Gene Csal_2413 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2413
Symbol
ID	4026850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	2708563
End bp	2709693
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	66%
IMG OID	637967615
Product	ABC transporter related
Protein accession	YP_574459
Protein GI	92114531
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.392798
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGCAT TGAACATCCG TCACGTCGAC AAGACGTTCG GTAGCACGCA AGTACTCAAG 
GATATTTCGC TGTCGATCGA CTCCGGCGAG TTCCTGATTC TGGTCGGCCC CTCGGGATGC 
GGGAAGTCGA CGCTGATGAA TGCCATCGCG GGGCTGGAAC CGGTGACGTC CGGCGAAATC 
CAGATCGGCG GTGAAGACGT CACCTGGCAT ACGCCGGCCG AGCGTGACAT CGCCATGGTG 
TTTCAGTCCT ACGCCCTGTA TCCGAGCATG AATGTGCGTC AGAACATCGC CTTCGGCCTG 
GAAATGCGCA AGATGCCCAA GGCCCAGCGC GAGGAGGCGG TCGCACGCGT GGCCGAGCTG 
CTGCAGATCA CGCCACTGCT CGACCGCAAG CCGTCGCAAC TCTCGGGCGG GCAGCGCCAG 
CGTGTCGCCA TGGGGCGGGC CCTGGCGCGC GAACCGCAGA TCTACCTGTT CGACGAGCCG 
CTCTCGAACC TGGATGCCAA GCTGCGTGTC GAGATGCGCA CCGAAATCAA GAAGCTGCAT 
CAGCGTCTGG GCACGACCAT CGTTTACGTG ACCCACGACC AGATCGAGGC CATGACCCTG 
GCCGATCGCA TTGCCGTGAT GCGCGACGGC GAGATCCTGC AACTGGGGAC GCCCGACGAA 
GTCTACAACG ACCCCGTGGA CATGTTCGTC GCGGGGTTCA TGGGCTCGCC GTCGATGAAC 
TTCATTCCCG TGACGCTGGT CAGCGGCGGC GACGGGTATG TGCTGCGCGT GCTCGATGGC 
GACGATCCCA CAGGGGCGCC ACTGGAGCTG CCCTGGCCGG CCGAGCGCGA TGCGCAGGCG 
CTGCAGGCGC GGGTCGGCGA GCGGCTGATC CTCGGACTGC GTCCCGAGCA CTTCGTCGAA 
GACGAAACGC GCATGGAAAC GTCGTTCGAC GGGACGCGGC TCGAGGTGAT GGCGACGGTG 
GTCGAGCCCA CCGGCGCGGA CATCCTGCTC CAGGCGACGC TGGGCGAGAC CGAGGCCACC 
ATGCGCCTGG GGCCCAAGAG TCGGGTGGCG GCCGGCGAGC GTGTCGCCCT GCGCGTCGAC 
ATGAGTCGGG CCGTGCTGTT CGAGGCGACG AGCCAGCGAC GCGTGGCCTA G

Protein sequence

MSALNIRHVD KTFGSTQVLK DISLSIDSGE FLILVGPSGC GKSTLMNAIA GLEPVTSGEI 
QIGGEDVTWH TPAERDIAMV FQSYALYPSM NVRQNIAFGL EMRKMPKAQR EEAVARVAEL 
LQITPLLDRK PSQLSGGQRQ RVAMGRALAR EPQIYLFDEP LSNLDAKLRV EMRTEIKKLH 
QRLGTTIVYV THDQIEAMTL ADRIAVMRDG EILQLGTPDE VYNDPVDMFV AGFMGSPSMN 
FIPVTLVSGG DGYVLRVLDG DDPTGAPLEL PWPAERDAQA LQARVGERLI LGLRPEHFVE 
DETRMETSFD GTRLEVMATV VEPTGADILL QATLGETEAT MRLGPKSRVA AGERVALRVD 
MSRAVLFEAT SQRRVA