Gene BBta_2120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_2120
Symbol
ID	5154389
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	+
Start bp	2196334
End bp	2197350
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	65%
IMG OID	640557057
Product	putative TRAP-type C4-dicarboxylate transport system, periplasmic component
Protein accession	YP_001238213
Protein GI	148253628
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCAG CCACATCCAT GTCCCGTCGC CGCTTCGTCG GCTCCGCGCT CGCAGGGGCC 
TCGGCTCTGG CGTTCGGGTC CGCGCAGGCG CAATCGGCCA AATATCGCCT GCGCTACGGC 
ACGGCGTTTC CCGCCACCCA TCCCGGCGTC ATCAGAATCA TCGAGGCGTC CGAGCTGATC 
AAGAAGCAGA CAAACGGCCT GGTCGATCTG CAGGTCTATC CGAACAGCCA GCTCGGCAGC 
GAGCCCGACA TGTTCTCGCA AGTCCGCTCT GGCGCGCTCG ACTTCATGTC GACGTCAGGC 
GTGAACCAGA CGGTGGTGCC GATCGGCGGC ATCAATGCGG TCGCCTTCGC GTTCGAGAGC 
TACGACCAGG TGTGGTCGGC GATGGATGGC GATCTCGGCA ACCATGTGCG TGGCGAGTTT 
GCCAAGGTCG GCCTGCACGT GCTGCCGAAA TGCCTCGACA ACGGCTACCG CAACATCACC 
TCCGGCGCCA AGCCGATCAC GTCGCCGGAC GACCTTAAGG GCTTCAAGAT CCGCGTGCCC 
GGCAATCCGC TGTGGGTGAC CTTGTTCAAG ACGCTGGGCG CCGCACCGAC GCCGATCAAT 
TTCGGCGAGC TCTATGCCGC CTTGCAGACC CGCATCGTCG ACGGCCAGGA GAATCCGCTG 
GCGCTGATCC AGAGCGCCAA GCTCTACGAG GTGCAGAAGT TCATCGCGCT GTCCGGCCAC 
ATCTGGGACG GCCATCACAT CTTCGCCAAT GCCACGCGCT GGAGCGGTTT GCCGGCCGAC 
GTGCGCGACG CCATCACCGC GGCGCTGTCG GATGCGGCGG TGAAGGAGCG GCAGGACATC 
CAGAGCTTCA ACGAGAAGGC GCAGGCCGAG ATGCAGGCCG CCGGCATCGC CTTCAACAAG 
GTCGATACCA AGCCGTTCCG CGACGCGCTG CGCACCGCCG GCTTCTATTC CGAGTGGAAG 
ACCAAGTTCG GTGCCGAGGC CTGGAGCCTG CTCGAGAAGT CGGTCGGCCA GCTCTGA

Protein sequence

MSSATSMSRR RFVGSALAGA SALAFGSAQA QSAKYRLRYG TAFPATHPGV IRIIEASELI 
KKQTNGLVDL QVYPNSQLGS EPDMFSQVRS GALDFMSTSG VNQTVVPIGG INAVAFAFES 
YDQVWSAMDG DLGNHVRGEF AKVGLHVLPK CLDNGYRNIT SGAKPITSPD DLKGFKIRVP 
GNPLWVTLFK TLGAAPTPIN FGELYAALQT RIVDGQENPL ALIQSAKLYE VQKFIALSGH 
IWDGHHIFAN ATRWSGLPAD VRDAITAALS DAAVKERQDI QSFNEKAQAE MQAAGIAFNK 
VDTKPFRDAL RTAGFYSEWK TKFGAEAWSL LEKSVGQL