Gene Smed_3620 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3620
Symbol
ID	5318151
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	55217
End bp	56431
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	61%
IMG OID	640775434
Product	NADH dehydrogenase I, D subunit
Protein accession	YP_001312367
Protein GI	150375771
COG category	[C] Energy production and conversion
COG ID	[COG0649] NADH:ubiquinone oxidoreductase 49 kD subunit 7
TIGRFAM ID	[TIGR01962] NADH dehydrogenase I, D subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.761398
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAG TCACCGAGCT CATGAGGCCG GAAGGCGAAG CGCTCAATAC CAAGGAGGTG 
CTTCTCAATC TCGGTCCGCA ACACCCGAGC ACCCATGGGG TTCTGCGGCT CGTGCTGCAA 
CTCGACGGCG AATATGTCGA GCGCATCGAC CCCCATATCG GCTATCTGCA CCGTGGCACC 
GAAAAGCTGG CGGAGAGCTT CACCTATACG CAAATCTTCC CGCTGACTGA CCGGCTCGAC 
TATCTCTGTC CACCTTCGAA CAACCTGGCC TTCGCGCTCG CCGTGGAAAA GCTGCTCGGC 
ATAGAGGCCC CGATCCGGGC GCAATACATC CGCGTGATGA TGGCCGAACT CGCAAGGATT 
TCCGGCCATC TCCTGATCAC CGGCGCACTG CCGATGGACC TGGGCGCCAT GACCGCGCTG 
CTTTACGCCA TGCGAGAGCG CGAAATGATC ATGGACCTCC TGGAAATGAT CACCGGTGCG 
CGCATGCACA CGTCCTACTG CCGCGTCGGC GGGGTGCGCG AGGACCTGCC CGACGGGTTC 
CTTCCGAAGA TCCGGGAGTT CTGCGAGATA TTCCCGAACA GGATCCGCGA CTATGAGCGC 
CTGATAGAGA ACAACCGGGT GTTTCTCAGC CGTACTCAGG GGATCGGCGT GATCTCCGCG 
GCGGACGCGG TCGACCTCGG CTTGAGCGGA CCGAACCTGC GTGCCTCCGG CGTCGACTGG 
GACATCCGGC GCGACGAACC CTATGAAATC TACGACCGGC TCGATTTTGA CGTCATCACG 
CGCGAGGAGG GCGATTGCTA TGCGCGCTGG CTTTGCCGGG TCGACGAGAT GCGAGAGAGC 
ATCCGCCTCA TCGAACAATG CATGGAGCAG ATGCCGGAGG GGCCGTTTCA GGTCGATATT 
CCGACGATCG CCTTCCCCGT CGATAAAGAG CGCGTGCATT GCTCGATGGA AGCACTGATC 
CAGCATTTCG ATCTCTCCGC CTACGGCTTC GACGTACCCG CGGGGGAAGT CTATTCGGTA 
ATCGAGGCGC CCAAGGGGGA ACTCGGCTTC TACATCATCA GCGACGGATC GCCAAAGCCG 
TTCCGCATGA AGGTGAGGGC CCCGTCCTTC GTCAATCTCC AGGCGCTCTT CGGGGTCACC 
AATGCACGTT ACCTCGCCGA TATGATCGCC GTGCTCGGCA GTCTCGACCC GGTGATGGCG 
GAGGTGGACA AGTAG

Protein sequence

MTEVTELMRP EGEALNTKEV LLNLGPQHPS THGVLRLVLQ LDGEYVERID PHIGYLHRGT 
EKLAESFTYT QIFPLTDRLD YLCPPSNNLA FALAVEKLLG IEAPIRAQYI RVMMAELARI 
SGHLLITGAL PMDLGAMTAL LYAMREREMI MDLLEMITGA RMHTSYCRVG GVREDLPDGF 
LPKIREFCEI FPNRIRDYER LIENNRVFLS RTQGIGVISA ADAVDLGLSG PNLRASGVDW 
DIRRDEPYEI YDRLDFDVIT REEGDCYARW LCRVDEMRES IRLIEQCMEQ MPEGPFQVDI 
PTIAFPVDKE RVHCSMEALI QHFDLSAYGF DVPAGEVYSV IEAPKGELGF YIISDGSPKP 
FRMKVRAPSF VNLQALFGVT NARYLADMIA VLGSLDPVMA EVDK