Gene Gobs_1930 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_1930
Symbol
ID	8753601
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	+
Start bp	2003033
End bp	2004163
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	72%
IMG OID
Product	alanine dehydrogenase
Protein accession	YP_003409004
Protein GI	284990450
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.275818
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACGC TCGTCGTCGG AGCACCGACC GAGATCAAGG ACAACGAGCG GCGGGTGGCA 
CTCACCCCCG ACGGTGTCGT GGAGCTGCTG CACGACGGTC ACCAGGTCGT CGTGCAGGCC 
GGTGCCGGCG TCGGGTCCCG GTTCGCCGAC GACGAGTACG CGGCGGCCGG CGCCAAGGTC 
GTGCCGACCG CCGAGGAGGT GTTCAACGCG GCCGACCTCA TCGTCAAGGT CAAGGAGCCG 
GTGCCCGCGG AGTACGACCG CTTCCGCCGG GGCCAGCAGC TGTTCACCTA CCTGCACCTC 
GCCGCCGACC GCGGGCTGAC CGAGTTCCTG CTGAAGCGGC GGATCGACTC CATCGCCTAC 
GAGACCGTGC AGACCGCTGA TGGCAAGCTC CCGCTGCTGA CCCCCATGAG CGAGGTCGCG 
GGCCGGATGG CCGTGCAGGC CGCCGCGCAC CACCTGGAGA ACCCGGCCGG TGGAGCGGGG 
ATCCTGCTCG GCGGCGTCCC CGGCACCCCC GCGGCGAAGG TCCTCATCAT CGGCGGCGGG 
GTGGCCGGCA CGGAGGCGGC GAAGATCGCG CTGGGGATGC GGGCCATCGT CCGGGTCCTC 
GACACCAACC CGAGCCGACT GGCCTACCTG TCCGACATCT TCGGCGGGCG GCTGGACCTG 
GTGACGCCCA ACCGCGCCCG GACGGCGGCC TACGTCGCCG AGGCCGACGT CGTGATCGGC 
GCGGTCCTCG TGCCCGGCGC CAGGGCACCC AAGCTCGTCA GCAGGGACAT GATCGCCGCG 
ATGCGCCCGG GCAGCGTGGT CGTCGACATC GCGATTGACC AGGGCGGCTG CTTCGAGACC 
AGCCGGCCGA CCACCCACTC CGACCCCACC TACGTCGAGG AGGGCGTCGT CCACTACTGC 
GTGGCCAACA TCCCCGGGGC GGTGTCCCGT ACCTCGACCC TGGCCCTGAC CTCGGCCACG 
CTGCCGTACC TGGTCCGGGT CGCGCAGCAC GGCGTGGTCG GCGCGGCCCA GGCCGACCCC 
GCCCTGCGTC TCGGGCTCAG CACGCTCGAC GGGCAGCTCG TCAACCAGCC GGTCGCCGAG 
GCCCACGAGC TGCCCTTCAC CGACCCCGCC GAGCTCCTCG TCGCACGGTG A

Protein sequence

MSTLVVGAPT EIKDNERRVA LTPDGVVELL HDGHQVVVQA GAGVGSRFAD DEYAAAGAKV 
VPTAEEVFNA ADLIVKVKEP VPAEYDRFRR GQQLFTYLHL AADRGLTEFL LKRRIDSIAY 
ETVQTADGKL PLLTPMSEVA GRMAVQAAAH HLENPAGGAG ILLGGVPGTP AAKVLIIGGG 
VAGTEAAKIA LGMRAIVRVL DTNPSRLAYL SDIFGGRLDL VTPNRARTAA YVAEADVVIG 
AVLVPGARAP KLVSRDMIAA MRPGSVVVDI AIDQGGCFET SRPTTHSDPT YVEEGVVHYC 
VANIPGAVSR TSTLALTSAT LPYLVRVAQH GVVGAAQADP ALRLGLSTLD GQLVNQPVAE 
AHELPFTDPA ELLVAR