Gene BBta_5141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_5141
Symbol
ID	5153364
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	5374176
End bp	5375336
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	66%
IMG OID	640559917
Product	putative alcohol dehydrogenase
Protein accession	YP_001241044
Protein GI	148256459
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.237581
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.0395804
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGACTGC ATCAATATCC TCCGATGGAG CAGGTCATTT TCGGCAAGCC GGCGGGCCTC 
GCGTTGCGCG AGGAGGCCGA GCGGAAGGGC GCGCAGCGTG TCTTCCTGAT CGCAAGCCGG 
ACGCTGAACA CGACGACGGA CGAGATCGAC AAGATCAGGT CGGCGCTGGG CGAACGCTAT 
GCGGGCACGT TCGATCAGGT GCCGCAGCAC ACCACGCGGG ATTCGGTGGT CGAGGCCGCC 
GGCCATGCCG CGCAGGCGAA GGCCGATCTC GTCGTCGCGA TCGGCGGCGG CTCGGTGGTC 
GACGCCGCCA AGATCGTGCT GATGTGCCTC GAGCACAGCA TCACGGATGC GTCCGGGCTC 
GATGGTTTCG AGCTGGTCTC GACGCCCCAA GGACCGCGTC CGGGGCCATT CCGCAATCCC 
AAGGTGAGGA TGATCGCCAT CCCGAGCACG CTGTCCGGCG GAGAGTACAA TGCCGGCACG 
CTGGTGACCG ATACACGTCG CAAGCTCAAG CAGATCTTCG TGCATCCGCT GATGATGCCG 
ATCTCGATCA TTCTGGATCC GGCCATCACC GTGCACACGC CGAGAACCCT GTGGCTCGGC 
TCGGGCACGC GAGCGATGGA TCACGGCATC GAGGCGGTTT GCTCGCCCCG CGGCAACCCG 
CTGGTCGAGA GCGTCTGCCT GCGCGGTCTC CGCTATCTCT ATGATGGTCT GCTGGCCTAT 
GCCGACAACG CGGACAGTCT CGAAGCCCGC CAGATGTGCC AGCTCGGATC CTGGCTGTCG 
GCCTTCGGGC TGCAATGCCG CGTGCCGATG GGCGCCAGCC ACGCGATCGG GCACGTCCTC 
GGCGGGACCT GCGACGTGCC GCATTATCTG TGCACGGCAG TGATGATGCC GAGCGTGCTG 
AAATACAACA AACCGGCGAC CGGCGCCGCG CAGAAGCTGT TGGCCGAGGC GTGGCACGAA 
CCGGAGGCCG ACGCCAGCGA GGTCTTCGCA CGCTTCATCG CCCGCCTCGG ATTGCCGACG 
CGGCTGGCCG ATGTCGGCGT CACGGAGGAT CGCTTCGGCC TGATCGGAAA CAACGCGATG 
CTCTCGGTCT TTACGCCCGC CAACCCGCGG CCGATCAAGG GGCCGGACGA CGTCGTCGAG 
ATTCTTCGGC TGGCGGCATA G

Protein sequence

MGLHQYPPME QVIFGKPAGL ALREEAERKG AQRVFLIASR TLNTTTDEID KIRSALGERY 
AGTFDQVPQH TTRDSVVEAA GHAAQAKADL VVAIGGGSVV DAAKIVLMCL EHSITDASGL 
DGFELVSTPQ GPRPGPFRNP KVRMIAIPST LSGGEYNAGT LVTDTRRKLK QIFVHPLMMP 
ISIILDPAIT VHTPRTLWLG SGTRAMDHGI EAVCSPRGNP LVESVCLRGL RYLYDGLLAY 
ADNADSLEAR QMCQLGSWLS AFGLQCRVPM GASHAIGHVL GGTCDVPHYL CTAVMMPSVL 
KYNKPATGAA QKLLAEAWHE PEADASEVFA RFIARLGLPT RLADVGVTED RFGLIGNNAM 
LSVFTPANPR PIKGPDDVVE ILRLAA