Gene Rru_A3678 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A3678
Symbol
ID	3837134
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	4225525
End bp	4226520
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	60%
IMG OID	637827802
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_428759
Protein GI	83595007
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTTT CCGTATTTAT GGGACTGATT CTGGGGGGGG TGATGATCGC CGGGGGCGCT 
CAGGCCGCCG ATGAACCGAT CGTCATTAAA TTCAGCCATG TCGTGGCGCC CGATACCCCC 
AAGGGCAAGG CCGCCGAGAT GTTCAAGAAG CTGGCCGAGG AAGGCACGGC CGGCCGCGTC 
AAGGTCGAGG TCTATCCCAA CTCGCAGCTT TACAAGGACA AAGAGGAACT CGAAGCCCTC 
CAGCTTGGCG CCGTGCAGAT GCTGGCGCCG TCCCTGGCCA AATTCGGGCC GCTGGGCGTC 
AAGGAATTCG AGGTTTTCGA CCTGCCCTAC ATCTTCCCGA CCAAGGACGT GCTGCGCGCC 
GTCACCGACG GGCCGATCGG CGCCTCGCTG CTCAAGAAGC TGGAAGGCCG CGGCATCAAA 
GGCTTGGCCT ATTGGGATAA CGGCTTCAAG ATTTTCAGCG CCAACAAGCC GCTGCTCAAG 
CCCGACGACC TCAAGGGCGT GAAGATGCGC ATCCAGTCAT CGAAGGTGCT CGATGCCGAA 
ATGCGCGCGC TGGGCGCCCT GCCGCAGGTG ATGGCCTTCT CGGAAGTCTA TCAGGCCCTG 
CAGACCGGCG TTGTCGACGG CACCGAAAAC CCGCCGTCGA ACATGTATAC CCAGAAGATG 
CACGAAGTGC AGAAGCATGC CACGCTGACC AATCACGGCT ATCTGGGCTA TGCGGTCATC 
GTGAACAAGA AGTTCTGGGA AGGCCTGCCC GCCGATATCC GCGCACCGCT GGAAACGGCG 
ATGGCGGACT CCACCAAGTT CGCCAATGCC ATCGCCCAGC AGGAAAACGA CGATTCGCTC 
GCGGCGATGA AGGCTTCGGG CAAGACCGAA TTCCACATGC CCTCCGAGGA TGAACTGAAG 
GCCTGGCAAG ACGCCCTGCT GCCCGTTCAC AAGGAGATGG AAGGCCGCGT CGGCAAGGAT 
CTGATCGAGT CGATTTACGC CGTTTCCAAG CAGTAG

Protein sequence

MKLSVFMGLI LGGVMIAGGA QAADEPIVIK FSHVVAPDTP KGKAAEMFKK LAEEGTAGRV 
KVEVYPNSQL YKDKEELEAL QLGAVQMLAP SLAKFGPLGV KEFEVFDLPY IFPTKDVLRA 
VTDGPIGASL LKKLEGRGIK GLAYWDNGFK IFSANKPLLK PDDLKGVKMR IQSSKVLDAE 
MRALGALPQV MAFSEVYQAL QTGVVDGTEN PPSNMYTQKM HEVQKHATLT NHGYLGYAVI 
VNKKFWEGLP ADIRAPLETA MADSTKFANA IAQQENDDSL AAMKASGKTE FHMPSEDELK 
AWQDALLPVH KEMEGRVGKD LIESIYAVSK Q