Gene Rsph17025_2001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_2001
Symbol
ID	5082365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	2044038
End bp	2045333
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	67%
IMG OID	640483563
Product	NADH dehydrogenase I subunit F
Protein accession	YP_001168197
Protein GI	146278038
COG category	[C] Energy production and conversion
COG ID	[COG1894] NADH:ubiquinone oxidoreductase, NADH-binding (51 kD) subunit
TIGRFAM ID	[TIGR01959] NADH-quinone oxidoreductase, F subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.675506
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAAGG ACCAGGACCG GATCTTCACC AACCTCTACG GGATGGGCGA CCGCAGCCTG 
AAGGGCGCGA TGGCGCGCGG CCAGTGGGAC GGGACGGCCG ACCTGCTCGC GCTCGGCCGC 
GACCGGATCA TCGACATCGT GAAGACCTCC GGCCTGCGCG GCCGGGGCGG CGCGGGCTTC 
CCGACCGGCC TCAAATGGTC CTTCATGCCC AAGCAGTCGG ACGGCCGCCC GTCCTACCTT 
GTGATCAACG CCGACGAATC CGAGCCCGCG ACCTGCAAGG ACCGCGAGAT CATGCGGCAC 
GACCCCCACA CGCTGATCGA GGGCGCGCTG CTCTCGGGCT TCGCGATGGG GGCGGTCGCG 
GCCTACATCT ACATCCGCGG CGAATATATC CGCGAGAAGG AGGCCCTGCA GGCCGCCATC 
GACGAGGCCT ATGACGCGGG CCTGATCGGC CGGAACGCCG CGAAGTCGGG CTACGATTTC 
GACATCTACC TGCATCACGG CGCGGGCGCC TACATCTGCG GCGAAGAGAC CGCGCTGCTG 
GAAAGCCTCG AAGGCAAGAA GGGGATGCCG CGGATGAAGC CGCCGTTCCC GGCCGGCTCG 
GGCCTTTACG GCTGCCCGAC CACGGTGAAC AACGTGGAGT CCATTGCCGT CATTCCCGCG 
ATCCTGCGCC GGGGCGGCGA GTGGTTCGCG GGCTTTGGCC GGCCGAACAA CGCGGGCGTG 
AAGCTCTTTG CCATGTCGGG GCATGTGAAC ACGCCCTGCG TGATCGAGGA GAGCATGTCG 
ATCTCGATGA AGGAGCTGAT CGAGAAGCAT GGCGGCGGCG TGCGCGGCGG CTGGAAGAAC 
CTCAAGGCGG TGATCCCCGG CGGCGCCTCC TGCCCGATCA TCCCGGCCGA GCAATGCGAA 
GATGCGGTGA TGGACTATGA CGGGATGCGC GAGCTGAAGT CGAGCTTCGG CACCGCCTGC 
ATGATCGTGA TGGACCAGCA GACCGACGTC ATCAAGGCGG TCTGGCGGCT GGCCAAGTTC 
TTCAAGCACG AAAGCTGCGG CCAGTGTACG CCCTGCCGCG AGGGCACGGG CTGGATGATG 
CGGGTCATGG ACCGCCTCGT GCGCGGCGAG GCCGAGGTTG AAGAAATCGA CATGCTGCTC 
TCGGTCACGA AGCAGGTCGA GGGCCACACG ATCTGCGCGC TCGGCGATGC GGCGGCCTGG 
CCGATCCAGG GTCTGATCCG GCATTACCGC GAAGAGATCG AGGACCGGAT CAAGGCGAAG 
AAGACCGGGC GCATGGGCGC CATGGCGGCG GAATGA

Protein sequence

MLKDQDRIFT NLYGMGDRSL KGAMARGQWD GTADLLALGR DRIIDIVKTS GLRGRGGAGF 
PTGLKWSFMP KQSDGRPSYL VINADESEPA TCKDREIMRH DPHTLIEGAL LSGFAMGAVA 
AYIYIRGEYI REKEALQAAI DEAYDAGLIG RNAAKSGYDF DIYLHHGAGA YICGEETALL 
ESLEGKKGMP RMKPPFPAGS GLYGCPTTVN NVESIAVIPA ILRRGGEWFA GFGRPNNAGV 
KLFAMSGHVN TPCVIEESMS ISMKELIEKH GGGVRGGWKN LKAVIPGGAS CPIIPAEQCE 
DAVMDYDGMR ELKSSFGTAC MIVMDQQTDV IKAVWRLAKF FKHESCGQCT PCREGTGWMM 
RVMDRLVRGE AEVEEIDMLL SVTKQVEGHT ICALGDAAAW PIQGLIRHYR EEIEDRIKAK 
KTGRMGAMAA E