Gene Csal_1747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1747
Symbol
ID	4028274
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	1990520
End bp	1991584
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	62%
IMG OID	637966935
Product	TRAP dicarboxylate transporter, DctP subunit
Protein accession	YP_573798
Protein GI	92113870
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACAA CCACAACGAC ACGCTTCGTT TCCGTCGTGG GCGGCGCCGT TCTCGGCTTG 
ACCGCGTTCA GCGCCTCTGC GGCGACCGAA ATGCCTCCGC TGCCGGAGGT CAAAGGTGAG 
AAGGTCGAGG CCGACGGCAA TTTCAAGATC AAGTTCAGCA TCGGCACCAC GGAATCCGGC 
GCGCAATACC GCGGCCTCGA ATATTTCGAG AAGATCGTCG AACAACGCAG CGACGGCAAC 
ATTCAGGTCG AACTGTTCCC GGGCGCCCAG TTGGGCGATG ACCGCCAGGC CACCAGTGCG 
CTCCAGTCGG GCACGCTGGA AATGACCATG CCGTCGACGT CTCCGCTGGT GAACATGTTC 
CCGGAATTCG CGGTGTTCGA CCTCCCCTTC CTCTTCCCGC AGCCTGAAAT GGCGGATGCG 
GTACTCGACG GCGAGATCGG CCAGCAGATG CTCGAAGACG CGTCCTCGCA AGGCCTGGTG 
GCGATCGGCT GGGGTGAAAA CGGTTACCGT CAGCTGACCA ACAGCCAGCA CCCGGTCGAG 
GAGCCGGCGG ACCTCGACGG CCTGAAGATC CGTACCATGG AGAACGATCT CCACCTGGAT 
ATCTGGCGCA CCCTGGGGGC CAACCCGACG CCGATGTCCT TCGCGGAGCT GTTCACGGCG 
CTCGAGCAAG GGGTCGTCGA CGGTCAGGAA AATCCGTGGA TCACCATCGA ATCCTCCAAG 
TTCAACGAGG TGCAGGACTA CGCCACCGAA ACCAACCACG TCTACACACC GTTCATCACG 
CTGGTCTCCG CGCGTTTCTG GGATCGTCTG CCGGAAGACT ACCAGCAGCT GCTGCGCGAC 
GCGGCCACCG AGATGGGCGA CTATCAGCGC CACGTCAGCC GCACGCTGAA CGATCAGATC 
AAGCAGGATC TGAAGGATTC CGGCATGCAG ATCACCGAGC TGACGCCGGA GCAGGTCAAG 
GTCTTCCAGG ACAAGCTGGA GCCGGTGTAT GAAGACTGGC GCGACCAGAT CGGCGGCGAG 
CTGATCGACG ATATCCGCGC CCAGGTGGAA CAAGCGCAAG AGTAA

Protein sequence

MTTTTTTRFV SVVGGAVLGL TAFSASAATE MPPLPEVKGE KVEADGNFKI KFSIGTTESG 
AQYRGLEYFE KIVEQRSDGN IQVELFPGAQ LGDDRQATSA LQSGTLEMTM PSTSPLVNMF 
PEFAVFDLPF LFPQPEMADA VLDGEIGQQM LEDASSQGLV AIGWGENGYR QLTNSQHPVE 
EPADLDGLKI RTMENDLHLD IWRTLGANPT PMSFAELFTA LEQGVVDGQE NPWITIESSK 
FNEVQDYATE TNHVYTPFIT LVSARFWDRL PEDYQQLLRD AATEMGDYQR HVSRTLNDQI 
KQDLKDSGMQ ITELTPEQVK VFQDKLEPVY EDWRDQIGGE LIDDIRAQVE QAQE