Gene Smed_3166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3166
Symbol
ID	5324045
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	3327336
End bp	3328856
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	63%
IMG OID	640792114
Product	putative dehydrogenase transmembrane protein
Protein accession	YP_001328825
Protein GI	150398358
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.689634
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGA GCATGAAGAG CCAACCGGAC ATCGTCATCA TCGGTTCGGG CGTCGGCGGC 
GCGACGGTTG CTGCCGGGCT CGCCGCCTCC GGCGCCGAGA TCCTCATTCT CGAAGCCGGC 
CACCACATCG AGGACCTGCC GGTAAATCGC GACCAGCGGG CGATCTTCCA GCGCGGCCAC 
TTCCGACCGA AGGAAACTTG GTATGAAGAG GGTGGTCCCG GCTTCAATCC CGGGAATTAC 
TACAATGTCG GAGGCAATTC GAAATTCTAC GGGGCGGTGC TCACCCGCTA CCGTCGTGAG 
GATTTCGAGG AGATGCAGCA TCTGGACGGT GTTTCGCCCG CCTGGCCGTT TCCCTATGAG 
GAGCTCGAAC CGTGGTATTC GAAGGCGGAA GAGCTCTATC AGGTGCGGGG CCGGCTCGGC 
GAAGATCCGA CCGAGCCCGT TCATTCGCGC GATTACCCTC ATGGTCCGGT GCCGGACGAA 
CCGGCGATCG CCAAGGTCCG CAAGCGCCTG GCGGAGGTTG GGATGCACCC CTATTCGCTG 
CCGCTCGGGG TGGATATCGA CCGATGGCTC GCCAAAGGCA AGACGCCCTG GGACGCGCAT 
CCGAACGCCT TCGACGGAAA GATGGATGCC GAGACGGCAG CTCTGGCGAC AGCACTCGAG 
CATCCGAACG TGCACCTCCA GACCGGCTCT CGGGTGACGC GGCTTGCAAC CGCGCCGGAC 
GGCAAGGCAA TCGAGACTGT TCACTACGTC AAGGATGGGA CGGAGCACCG CATCTCGCCG 
AAGCTCGTGG TTCTCTCGGC AGGCGCGGTT CAGTCGGCAG TCCTGCTTCT GCGCTCGGCG 
GACGACCGCA ATGCGTCGGG GCTTGCCAAC GGTTCCGATC AGGTCGGCCG CAATTTCATG 
AACCACAATT CGAGCGCCGT CATTGCTCTC AGCCCCTGGT ACCGCAACGA TTCGGTTTAT 
CAGAAGACCT TCGGTCTCAA TGATTTCTAT CTATCCGACG GGCAGGGCGG GCCGCCGCTC 
GGCAATATTC AGCTCCTCGG CCGCATCTCC GGCGCGATCC TGAAGGCGAA CATGCCCGGC 
TTGCCGGAAT GGCTCCTGAA CCAGGTATCG GCGCGCGGCA TCGACTTCTA CGCCATGAGC 
GAGGATCTGC CTTCGTCGGA AAGCCGCGTG ATGGTCGATG GGGAGCGTGT CGTGCTGAAA 
TGGGTACGCA CGAATTGGCA GGCGCATCTC GACCTCGTCG CCAAGCTGAA GGCGGTGCTC 
AAAAAAGCCG GTTTCCCGAT CGTGGTCGCG CGAGCCTTCG ACAAGCGGAC GCCGTCGCAT 
CAATGCGGCA CGGTGCGTAT CGGCATCGAT CCCGCACAGG CGCCGCTCGA CGTCTATTGC 
CGCGCCTTCG ATCATCCGAA CCTCTTCGTC GTAGATGCCA GCTGCCTGCC GACCTCGGCC 
GCCGTCAATC CGGCGCTGAC GGTCGCGGCC CAGGCGCTGC GCGTTGCGGA CCATATCGTG 
AAACAGGACC TGCGATCATG A

Protein sequence

MSQSMKSQPD IVIIGSGVGG ATVAAGLAAS GAEILILEAG HHIEDLPVNR DQRAIFQRGH 
FRPKETWYEE GGPGFNPGNY YNVGGNSKFY GAVLTRYRRE DFEEMQHLDG VSPAWPFPYE 
ELEPWYSKAE ELYQVRGRLG EDPTEPVHSR DYPHGPVPDE PAIAKVRKRL AEVGMHPYSL 
PLGVDIDRWL AKGKTPWDAH PNAFDGKMDA ETAALATALE HPNVHLQTGS RVTRLATAPD 
GKAIETVHYV KDGTEHRISP KLVVLSAGAV QSAVLLLRSA DDRNASGLAN GSDQVGRNFM 
NHNSSAVIAL SPWYRNDSVY QKTFGLNDFY LSDGQGGPPL GNIQLLGRIS GAILKANMPG 
LPEWLLNQVS ARGIDFYAMS EDLPSSESRV MVDGERVVLK WVRTNWQAHL DLVAKLKAVL 
KKAGFPIVVA RAFDKRTPSH QCGTVRIGID PAQAPLDVYC RAFDHPNLFV VDASCLPTSA 
AVNPALTVAA QALRVADHIV KQDLRS