Gene Csal_0303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0303
Symbol
ID	4025959
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	342267
End bp	343325
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	61%
IMG OID	637965453
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_572365
Protein GI	92112437
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.160879
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCTCCT TCGAGATAAC AAGAGGAATC AACGCCATGA AACGTACGCT TACCTGCATG 
CTCACCCTCT CCCTGACGGC GGCTGCCGTC TCCACCGCGC AGGCGGAAAC GACATTGCGC 
ATGTCGCATT TCTGGCCGGG CGCTTCCGCC ATCAACAAGC AGATCTTCGA CGCCTGGGCC 
GAGCAGGTGG AGAAAGACTC CAACGGTGAA CTCAAGGTCG AGAATTATCC CTCACAGACC 
CTGAGTCAGG CCGATGAAAC CTATGAAGCC GTCACCAACG GGATCGCCGA TATCGGAATC 
ACCGCGCAGG GCTACACCAA TGGCCGCTTT CCGCTGAGCC AGATCGTGGA GTTGCCGGGC 
GTGGCATCGT CGGCGCCGGA AGGCGCCTGC GTACTCCAGA CGCTCTACGA CGATGGCCAG 
ATCGCCAGCG AATACGACGA TACCCATGTG CTGTTCATGT TCACCACCGG GCCTGGGTAC 
ATTCATACCC GCGAGACGGA CGTGCAGACA CCGTCGGATC TTGAAGGCCT GCGCATGCGT 
CGCCCCACCG CCGTGGCGGG CAATATTCTC GACAACATGG GCGCCGAGCC GGTAGGCATG 
CCGGCCCCGG AGATCTACAC CTCCATGCAG CGCGGGGTGC TCGATGGCCT GAGCTTTCCC 
TGGGAAGGCA TGAAGACGTT CCGGCTCAAC GAGCTGGCCG AGTACCACAC CCAGGTGCCG 
TTCTACACGC TGATCTTCGT GGCCACCATG AGCCAGAGCA CCTATGACAG CCTGTCGCCC 
GAGCAGCAAA AGGCCATCGA CGAAAACTCC GGCATGAAGT GGGCCGACAA CGCCGGTGAG 
GTCTTCGCCT CGATCGATGC GGCCGGCAAG AAGGAAGCCG AGGAGGCGGG GCATACCATC 
CGCGTCATCG ACAATCCGCT GGAGGATTCC GCGTGGCAGA AACCACTCAA GGCGGGCATC 
GATAAATACC TCGGCGACCT GGAGTCGCGA GGCCTCGATC AAGCGCGTGA TGTCTATTAC 
GCCGCCCTCG AAGCACGTAA ATCCTGCTCA GCCGAATAA

Protein sequence

MASFEITRGI NAMKRTLTCM LTLSLTAAAV STAQAETTLR MSHFWPGASA INKQIFDAWA 
EQVEKDSNGE LKVENYPSQT LSQADETYEA VTNGIADIGI TAQGYTNGRF PLSQIVELPG 
VASSAPEGAC VLQTLYDDGQ IASEYDDTHV LFMFTTGPGY IHTRETDVQT PSDLEGLRMR 
RPTAVAGNIL DNMGAEPVGM PAPEIYTSMQ RGVLDGLSFP WEGMKTFRLN ELAEYHTQVP 
FYTLIFVATM SQSTYDSLSP EQQKAIDENS GMKWADNAGE VFASIDAAGK KEAEEAGHTI 
RVIDNPLEDS AWQKPLKAGI DKYLGDLESR GLDQARDVYY AALEARKSCS AE