Gene Csal_2100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2100
Symbol
ID	4029243
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	2368696
End bp	2369739
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	64%
IMG OID	637967299
Product	ABC transporter related
Protein accession	YP_574150
Protein GI	92114222
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1135] ABC-type metal ion transport system, ATPase component
TIGRFAM ID	[TIGR02314] D-methionine ABC transporter, ATP-binding protein

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.182492
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCAAAC TCGAAGGTGT CTCCAAAACC TATGGCGCCG GCCCCACGGC GGTCCACGCC 
CTCAAAAACA TCGACCTTGA CGTCCCGCAG GGCGCCATTC ACGGCGTCAT CGGCCTTTCG 
GGGGCCGGCA AGTCGACGCT GATACGTTGC GTCAATCTGC TCGAGCGTCC CACGTCGGGC 
CGCGTCATCG TCGACGGCCA GGACCTGACC CGACAGGATG CCGAGGCATT GCGGCAATCG 
CGTCATCAAC TGGGCATGAT CTTCCAGCAC TTCAATCTGC TGGCCTCGCG CACCGTTTTC 
GATAACGTGG CCCTGCCTCT GGAGTTGATG GGTGTGTCGA AGAGTGACAT TCGCGAGCGC 
GTCGAGCCAC TGCTCGACCT GACCGGGCTG ACCGACAAGG CGCGACAGTA TCCGGCCCAG 
CTCTCCGGCG GCCAGAAACA GCGCGTGGCC ATCGCGCGGG CTCTCGCCAG CCGCCCCAAG 
GTATTGCTGT GCGACGAGGC GACCTCCGCG CTCGACCCCC AGACCACGGC TTCGATTCTC 
GAGCTGCTGC AGGACATCAA CCGCAAGCTG GGCCTGACCA TTCTGCTGAT CACCCACGAA 
ATGGAAGTGG TCAAGAGCAT CTGCCATCGC GTCGGCCTGA TCTCCGACGG CGAACTGGTG 
GAAGAAGCCG ATGTCGGCGA TTTCTTCACG GCGCCCGCCA CGCGTCTGGG ACGTGATTTC 
CTCAACGCCT TCCTCGAGCT CGAGCCGCCC CAGGCCCTGG TCGAACGCCT CGAGGAGACA 
GCCGGTCCTC ACACCCACCC TGTCGTGCGA CTGGCATTCT CCGGCGCCAC GGTCGCGACA 
CCGCTCATTT CGCGCCTGGC CCGCGACAGC GGCGTCGACG TCAGCATCCT GCAGGCCAAG 
GTGGAGTCGA TCCAGGGACG CACGCTCGGC CTGATGATCG CCGAGCTCAT CGGCTCGCCC 
GACACGACGT CGCGGGCACT CACGCAACTC GAAGCACACG ATATCAACGT GGAGGTACTC 
GGCCATGTCC AGCGCGATGC TTGA

Protein sequence

MIKLEGVSKT YGAGPTAVHA LKNIDLDVPQ GAIHGVIGLS GAGKSTLIRC VNLLERPTSG 
RVIVDGQDLT RQDAEALRQS RHQLGMIFQH FNLLASRTVF DNVALPLELM GVSKSDIRER 
VEPLLDLTGL TDKARQYPAQ LSGGQKQRVA IARALASRPK VLLCDEATSA LDPQTTASIL 
ELLQDINRKL GLTILLITHE MEVVKSICHR VGLISDGELV EEADVGDFFT APATRLGRDF 
LNAFLELEPP QALVERLEET AGPHTHPVVR LAFSGATVAT PLISRLARDS GVDVSILQAK 
VESIQGRTLG LMIAELIGSP DTTSRALTQL EAHDINVEVL GHVQRDA