Gene Smed_0894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0894
Symbol
ID	5321735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	964304
End bp	965608
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	63%
IMG OID	640789834
Product	NADH dehydrogenase I subunit F
Protein accession	YP_001326584
Protein GI	150396117
COG category	[C] Energy production and conversion
COG ID	[COG1894] NADH:ubiquinone oxidoreductase, NADH-binding (51 kD) subunit
TIGRFAM ID	[TIGR01959] NADH-quinone oxidoreductase, F subunit

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.13206
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTAAAG ACGAAGATCG CATCTTTACC AACATCTACG GCCTCATGGA CAAGTCGCTC 
AAGGGCGCGA TGGCGCGAGG CCATTGGGAC GGCACGAAGC AGTTCCTGGA AAAGGGCCGC 
GACTGGATCA TCAACGAGGT GAAGGCTTCC GGCCTCCGCG GCCGCGGCGG CGCCGGCTTC 
CCGACCGGTC TCAAATGGTC CTTCATGCCG AAGGAGAGCG ACGGGCGCCC GCATTACCTC 
GTCGTCAATG CCGACGAGTC CGAGCCCGGC ACCTGCAAGG ACCGCGACAT CATGCGCCAC 
GATCCGCACA CGCTGATCGA GGGCTGCGTG ATTGCGAGCT TCGCGATGGG TGCGCATGCC 
GCCTATATCT ATGTTCGCGG CGAGTTCATC CGCGAGCGCG AAGCGCTGCA GGCTGCGATC 
GACGAATGTT ACGCATACGG CCTGCTCGGA AAGAACAACA AGCTCGGCTA CGACATCGAT 
ATCTTCGTGC ATCACGGCGC CGGCGCCTAT ATCTGCGGCG AGGAAACCGC GCTGCTCGAG 
AGCCTTGAAG GCAAGAAAGG CCAGCCGCGC CTGAAGCCGC CTTTCCCCGC GAATATGGGC 
CTTTACGGCT GCCCGACGAC TGTCAACAAC GTCGAGTCGA TCGCGGTTAC GCCGACCATC 
CTGCGCCGGG GCGCCGGCTG GTATACGAGC TTCGGCCGCC CGAACAATCA CGGCACCAAG 
CTCTATTCGG TTTCCGGACA CGTCAATCGC CCGTGCACGG TCGAGGATGC GATGTCCATC 
CCCTTCCATG AGCTTATCGA GAAGCACTGC GGCGGCATTC GCGGCGGCTG GGACAATCTG 
CTTGCCGTCA TTCCCGGCGG CTCTTCGGTC CCCTGCGTGC CCGGCGCGCA GATGAAGGAC 
GCGATCATGG ATTATGACGG CCTGCGCGAG CTCGGATCGG GTCTCGGAAC GGCTGCCGTC 
ATCGTCATGG ACAAGTCGAC CGACATCATC AAGGCGATCT GGCGGCTTTC GGCTTTCTAC 
AAGCATGAGA GCTGCGGTCA GTGCACGCCC TGCCGCGAAG GCACCGGCTG GATGATGCGC 
GTGATGGAGC GCATGGTGCA GGGCCGTGCC CAGAAGCGCG AGATCGATAT GCTCTTCGAC 
GTGACGAAAC AGGTCGAAGG CCACACGATC TGCGCGCTGG GCGATGCGGC GGCCTGGCCG 
ATCCAGGGCC TCATCAAGCA TTTCCGCCCG GAAATGGAGA AGCGGATAGA CGAATACACC 
CGCAACGCGA CTTCGCAAGG CGCGGTGCTG GAGGCAGCGG AGTAA

Protein sequence

MLKDEDRIFT NIYGLMDKSL KGAMARGHWD GTKQFLEKGR DWIINEVKAS GLRGRGGAGF 
PTGLKWSFMP KESDGRPHYL VVNADESEPG TCKDRDIMRH DPHTLIEGCV IASFAMGAHA 
AYIYVRGEFI REREALQAAI DECYAYGLLG KNNKLGYDID IFVHHGAGAY ICGEETALLE 
SLEGKKGQPR LKPPFPANMG LYGCPTTVNN VESIAVTPTI LRRGAGWYTS FGRPNNHGTK 
LYSVSGHVNR PCTVEDAMSI PFHELIEKHC GGIRGGWDNL LAVIPGGSSV PCVPGAQMKD 
AIMDYDGLRE LGSGLGTAAV IVMDKSTDII KAIWRLSAFY KHESCGQCTP CREGTGWMMR 
VMERMVQGRA QKREIDMLFD VTKQVEGHTI CALGDAAAWP IQGLIKHFRP EMEKRIDEYT 
RNATSQGAVL EAAE