Gene TM1040_0748 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0748
Symbol
ID	4076157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	804573
End bp	805871
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	61%
IMG OID	638006045
Product	NADH dehydrogenase I subunit F
Protein accession	YP_612743
Protein GI	99080589
COG category	[C] Energy production and conversion
COG ID	[COG1894] NADH:ubiquinone oxidoreductase, NADH-binding (51 kD) subunit
TIGRFAM ID	[TIGR01959] NADH-quinone oxidoreductase, F subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.147388
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAAGG ATCAGGACCG GATCTTTACC AACCTTTACG GGATGCACGA ACGCACGTTG 
GCGGGCGCAC AAAAGCGCGG CCACTGGGAC GGTACGGCGG GCCTCATTGA AAAAGGGCGC 
GACTGGATCA TCCAGACCAT GAAGGATTCC GGCCTGCGCG GGCGTGGCGG TGCGGGCTTC 
CCCACCGGCC TCAAATGGTC CTTCATGCCC AAGGAAAGCG ACGGGCGTCC CGCCTATCTG 
GTCATCAATG CTGATGAGTC CGAGCCCGGC ACCTGCAAAG ACCGCGAAAT CATGCGTCAC 
GATCCGCATA CGCTGATCGA GGGCGCGCTG ATCGCTTCCT TCGCGATGAA CGCGCACACC 
TGCTACATCT ATCTGCGCGG CGAATATATC CGCGAGCGCG AGGCGCTGCA GGCCGCCATC 
GACGAATGCT ACGACAAGGG TCTTCTGGGC AAGAACGCTG CAGGCTCGGG CTGGGATTTC 
GATCTTTTCC TGCACCACGG GGCAGGGGCT TATATCTGCG GCGAGGAAAC CGCCCTGATC 
GAGAGCCTTG AGGGCAAAAA AGGCATGCCG CGCATGAAGC CGCCATTCCC GGCAGGCGCG 
GGGCTTTATG GCTGCCCGAC CACGGTGAAC AATGTCGAAT CCATCGCCGT GGTGCCCACC 
ATCCTGCGGC GCGGTGCGGA GTGGTTTGCC GGCTTTGGCC GTCAGAACAA CGCGGGCACC 
AAGCTTTTTG CGATCTCCGG TCACGTCAAC AACCCCTGCG TTGTTGAAGA GGCCATGTCG 
ATCAGCTTTG AAGAGCTGAT TGAAAAACAC TGCGGTGGCA TTCGCGGCGG CTGGGACAAT 
CTTCTGGCGG TGATCCCAGG CGGCTCTTCA GTGCCCTGTG TGCGCGGCGA GAAGATGCGC 
GATGCGATCA TGGATTTTGA TTACCTGCGC GGCGAGTTGG GCTCTGGCCT TGGCACTGCG 
GCGGTGATCG TGATGGACAA GCAGACCGAT ATCGTCAAAG CGATCTGGCG CCTCTCGAAG 
TTCTACAAGC ACGAAAGCTG CGGCCAGTGC ACGCCCTGCC GTGAAGGCAC CGGCTGGATG 
ATGCGCGTGA TGGATCGTCT GGTGCGCGGT GAGGCGGAGC TTGAAGAGAT CGACATGCTC 
TGGGATGTCA CCAAGCAGGT CGAAGGCCAC ACCATCTGTG CACTGGGCGA TGCGGCCGCA 
TGGCCCATTC AGGGTCTCAT TCGCAACTTC CGTGAAGAGA TCGAAGATCG CATCAAGGCG 
CAGAAATCTG GCCGTATGGG CGCGATGGCA GCGGAATAA

Protein sequence

MLKDQDRIFT NLYGMHERTL AGAQKRGHWD GTAGLIEKGR DWIIQTMKDS GLRGRGGAGF 
PTGLKWSFMP KESDGRPAYL VINADESEPG TCKDREIMRH DPHTLIEGAL IASFAMNAHT 
CYIYLRGEYI REREALQAAI DECYDKGLLG KNAAGSGWDF DLFLHHGAGA YICGEETALI 
ESLEGKKGMP RMKPPFPAGA GLYGCPTTVN NVESIAVVPT ILRRGAEWFA GFGRQNNAGT 
KLFAISGHVN NPCVVEEAMS ISFEELIEKH CGGIRGGWDN LLAVIPGGSS VPCVRGEKMR 
DAIMDFDYLR GELGSGLGTA AVIVMDKQTD IVKAIWRLSK FYKHESCGQC TPCREGTGWM 
MRVMDRLVRG EAELEEIDML WDVTKQVEGH TICALGDAAA WPIQGLIRNF REEIEDRIKA 
QKSGRMGAMA AE