Gene TM1040_2781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2781
Symbol
ID	4076549
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2939877
End bp	2941073
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	62%
IMG OID	638008106
Product	iron-containing alcohol dehydrogenase
Protein accession	YP_614775
Protein GI	99082621
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.409479
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAGCG GGGGCAGCGC CCCCACCCCG GCTCACCATA GGAACATGCT GATGTCTCTC 
ATTGGAAACT GGTCTTATCC GACCGCAATC AAATTCGGCG CAGGCCGGAT CAAGGAACTG 
GCCGATGCTT GCGCGCAAGC CGGGATCAAA AAGCCGCTCT TGGTCACCGA CAAGGGGCTT 
GCAGATCTGC CCGTCACTCA ATCGACGCTC GATATCATGG AGGCCGCAGG CCTTGGGCGC 
GGGATGTTTT CTGAGGTCGA CCCCAACCCG AACGAGAAAA ACCTCGACGC GGGTGTTGCG 
GCCTACAAGG CAGGCGGCCA TGACGGTGTG ATCGCCTTTG GCGGCGGCTC CGGCCTCGAT 
CTGGGCAAAA TGGTTGCGTT CATGGCGGGC CAGACCCGCC CGGTTTGGGA TTTTGAGGAC 
ATCGGCGACT GGTGGACCCG CGCGGACGCG GATGCGATCG CCCCGATCAT TGCCGTGCCG 
ACCACCGCGG GCACCGGATC TGAGGTCGGG CGTGCCTCTG TCATCACCGA TAGCGCCACC 
CACCAGAAAA AGATCATCTT CCACCCCAAG GTTCTGCCCA CCGTGGTGAT TTGCGATCCG 
GAGCTTACCG TCGGGATGCC CAAATTCATC ACTGCCGGCA CCGGGCTTGA TGCCTTTGCC 
CATTGCGTCG AGGCGTTTTC CTCGCCGCAC TACCACCCGA TGTCACAGGG TATGGCGCTC 
GAGGGTATGC GCCTGGTCAA GGACTACCTT CCGCGCGCTT ATGCGGACGG CACCGACATT 
GAGGCGCGCG CGCACATGAT GTCTGCGGCT GCCATGGGCG CCACCGCGTT CCAAAAAGGT 
CTTGGCGCGA TTCACGCCAT GAGCCACCCG ATTGGCGCGC ATTTCAACAC GCACCACGGC 
ACCACCAACG CGGTCTGCAT GCCTGCAGTG CTGGAATTCA ACGCGTCCGA GATTTCCGAA 
CGCTTTGACA TGGCAGCGGC CTACCTCGGG ATCGAGGGCG GCTTTGAGGG CTTCAAGGCC 
TTCGTGCAAG AGTTCAACGA CAGCCTCGGC ATCCCGCGCG GCCTGTCTGC GTTGGGCGTG 
ACCGAAGAGT CGATCCCGGA GCTGGTCAAA GGCGCGATCA TTGATCCCAG CTGCGGCGGC 
AATCCCGTCA AGCTGACTGA GGAAAACCTC ACCCAGCTGT TCAAAGCCGC GCTTTGA

Protein sequence

MASGGSAPTP AHHRNMLMSL IGNWSYPTAI KFGAGRIKEL ADACAQAGIK KPLLVTDKGL 
ADLPVTQSTL DIMEAAGLGR GMFSEVDPNP NEKNLDAGVA AYKAGGHDGV IAFGGGSGLD 
LGKMVAFMAG QTRPVWDFED IGDWWTRADA DAIAPIIAVP TTAGTGSEVG RASVITDSAT 
HQKKIIFHPK VLPTVVICDP ELTVGMPKFI TAGTGLDAFA HCVEAFSSPH YHPMSQGMAL 
EGMRLVKDYL PRAYADGTDI EARAHMMSAA AMGATAFQKG LGAIHAMSHP IGAHFNTHHG 
TTNAVCMPAV LEFNASEISE RFDMAAAYLG IEGGFEGFKA FVQEFNDSLG IPRGLSALGV 
TEESIPELVK GAIIDPSCGG NPVKLTEENL TQLFKAAL