Gene TM1040_3014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3014
Symbol
ID	4076587
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	3181937
End bp	3183130
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	58%
IMG OID	638008343
Product	hypothetical protein
Protein accession	YP_615008
Protein GI	99082854
COG category	[R] General function prediction only
COG ID	[COG0820] Predicted Fe-S-cluster redox enzyme
TIGRFAM ID	[TIGR00048] radical SAM enzyme, Cfr family

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.327469
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGCCT CAGCGCCGAT CACCCAAGAT GTTTTGACCC TCCCCCGCAA AGAGCCGGAA 
GGCGGCAAGA TCAACCTTGT TGGTCTGACC CGTGACCGCA TGCGCGCGGT ATTGATCGAA 
AACGGCACCC CGGAGAAACA GGCCAAGATG CGCGTCGGGC AGATCTGGCA GTGGATCTAC 
CAATGGGGGG TACGAGACTT TGCGGAGATG ACAAATCTAG CCAAGGCCTA CCGCGCTCAG 
CTGGAGGAAA CATTCGAGAT CCGCATCCCC GAGGTGGTCT CAAAACAAGT GTCGACCGAT 
GGCACGCGCA AATATCTGGT GCGGATAAAT GGCGGCCATG AGGTTGAGGT GGTCTATATC 
CCCGAGGACG ACCGGGGCAC CTTATGCATT TCCTCTCAGG TCGGCTGTAC GCTCACCTGT 
TCGTTTTGCC ACACCGGCAC GCAAAAGCTG GTGCGCAACC TGACCCCGGC CGAAATCATC 
GGACAGGTGA TGATGGCGCG GGATGACCTG GAAGAATGGC CCACCCCCGG CGCGCCAAAG 
GATGAAACCC GCCTACTGTC CAACATCGTT CTGATGGGCA TGGGGGAGCC GCTTTATAAT 
TTCGACAATG TGCGCGATGC GATGAAGATT GCGATGGACC CGGAGGGGAT TTCCCTCTCG 
CGGCGTCGTA TCACGCTCTC GACCTCTGGC GTGGTGCCCG AGATTGCGCG GACGGCTGAG 
GAAATCGGCT GTCTCCTTGC GATATCCTTT CATGCGACCA CCAATGAGGT GCGCGATGTG 
CTGGTTCCGA TCAACCGTCG CTGGAACATC GATGAATTGC TGCAGGCGCT TGCAGATTAC 
CCGAAGGTCT CGAACTCTGA GCGGATCACC TTCGAATATG TGATGCTTGA TGGGGTGAAC 
GACTCTGATG AGGACGCACA TCGTCTTCTG GATCATATCA AGCGCCACAA CATTCCGGCC 
AAGATCAACC TCATTCCCTT TAATGAGTGG CCGGGGGCGC CCTATAAACG GTCGTCCAAC 
AACCGCATCC GGGCGTTTGC AAATATCATC TATCAGGCTG GCTATGCCTC GCCGATCCGC 
AAGACCCGCG GCGATGATAT CATGGCCGCC TGCGGTCAGC TCAAGTCTGC CACGGAGCGG 
GCCCGCAAGA GCCGCAAGCA AATCGAAGCC GAGGCCGGAG TGAACAACAG CTGA

Protein sequence

MTASAPITQD VLTLPRKEPE GGKINLVGLT RDRMRAVLIE NGTPEKQAKM RVGQIWQWIY 
QWGVRDFAEM TNLAKAYRAQ LEETFEIRIP EVVSKQVSTD GTRKYLVRIN GGHEVEVVYI 
PEDDRGTLCI SSQVGCTLTC SFCHTGTQKL VRNLTPAEII GQVMMARDDL EEWPTPGAPK 
DETRLLSNIV LMGMGEPLYN FDNVRDAMKI AMDPEGISLS RRRITLSTSG VVPEIARTAE 
EIGCLLAISF HATTNEVRDV LVPINRRWNI DELLQALADY PKVSNSERIT FEYVMLDGVN 
DSDEDAHRLL DHIKRHNIPA KINLIPFNEW PGAPYKRSSN NRIRAFANII YQAGYASPIR 
KTRGDDIMAA CGQLKSATER ARKSRKQIEA EAGVNNS