Gene Rleg_4008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4008
Symbol
ID	8014817
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	4086157
End bp	4087155
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	58%
IMG OID	644826577
Product	TRAP dicarboxylate transporter, DctP subunit
Protein accession	YP_002977788
Protein GI	241206692
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.182946
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAGAAT TCAATATCAT GCGGGCTCAC GCCGGTCGCC TTTCCATGTC CACCATCGCC 
GGCATCATGT TGCTTTGCAC CGGCCAAGCG AATGCCGAAA CTCTTCGGCT CGCCCACGCA 
TCGAGCTCGA AGAGCCTCAT TCAGGAGGCT GTCGTCATGT TCGCCGACAA GCTCGCCGGC 
GAAACCAAGG GCGGCCTTAC CGTCCAGATT TTTCCAGATG GTCAGTTGGG CGATGAGGGA 
CCGATCGCCG ATGGTGTCGG CTCCGGCTCC ATCGATATCG GGTTAGGCGG CGTTGCCGAT 
GCGATCGATC CGAAGCTCAA CGTCGTCACC TTGCCGTTCT TGTTTTCCGA TGCAAACGCA 
GCGCACACCT TTCTCGACGG ACCAGTCGGG AAGAAGGTCT TCGACACGGG TGCCGACAAC 
GGCTTCAAGA TGCTCGGCGC GCTTGATTCC GGTTTCCGCC AATTTGCAAC TGTCAGCAAA 
TCAATCGCGA CGCCGGAGGA TATCAAGGGT CTGAAGCTGC GCACGCCGCC GAACCCCGTC 
ATTCTCGCAA CCATCGAACA GCTGGGTGCC CTGCCGCAAT CGATTCCATT CGGGGAGGTC 
TATACCTCGC TGCAATCGCA TGTGGTCGAC GGCGTGGAGC CGGAAATACG CGATTTCGCG 
GATCAGAAAT GGTACGAAAG CGCGAAGTTC CTATCGGTCT CGAACTATAT CTGGACGCCG 
AATTACTGGT TCATGAACAA GGAGCGCTTC GACGCTCTGA GCCCGGAAAA CCAGGCTGCG 
GTGACCAAGG CAGTCGAAGA GACGACGATC TGGTACCGCG GAAAACTCGA CGAAGTCTAT 
GCCCAGGTCA TTGAGGACCT CAAGTCGAAG GGCGTCACCG TAACGACGGT GGACACGACA 
CCCTTCCGTG CGATGGTTGA TCCTGTCTAT GTGAAATTCG GGGCGGAATG GGGCGACGAT 
CTGGTGTCGT CCGTGCGCTC GGCAGCAGCC GGAAAATAG

Protein sequence

MLEFNIMRAH AGRLSMSTIA GIMLLCTGQA NAETLRLAHA SSSKSLIQEA VVMFADKLAG 
ETKGGLTVQI FPDGQLGDEG PIADGVGSGS IDIGLGGVAD AIDPKLNVVT LPFLFSDANA 
AHTFLDGPVG KKVFDTGADN GFKMLGALDS GFRQFATVSK SIATPEDIKG LKLRTPPNPV 
ILATIEQLGA LPQSIPFGEV YTSLQSHVVD GVEPEIRDFA DQKWYESAKF LSVSNYIWTP 
NYWFMNKERF DALSPENQAA VTKAVEETTI WYRGKLDEVY AQVIEDLKSK GVTVTTVDTT 
PFRAMVDPVY VKFGAEWGDD LVSSVRSAAA GK