Gene Csal_0219 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0219
Symbol
ID	4027302
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	245720
End bp	246688
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	65%
IMG OID	637965370
Product	ABC-type glycine betaine transport system protein
Protein accession	YP_572282
Protein GI	92112354
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID	[TIGR03414] choline ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGACTG CATCCCACCC GCTGGCGCGC GGCACCAAGG CGGCGCTGCT TGGTGCCTGC 
CTGGCCGGCC TGCCGCTGGG CATGGCGCAG GCGCAGGACG ACACGACGGA CGTGCGCTTT 
TCCGTACCAC CGTGGCCGGG CGTGACGGTC AAGACCGAAC TCGCCGCGCA GTTGCTCGAT 
ACGCTGGGGT ATACGCCGCA GCAGGAGCAG CTCGGCACCA CCATCACCTA CCAGGCGCTC 
AACCAGAACG AGTTGGACGC CTTCCTCGCC GGATGGCTGC CCGCCCAGCA GGGCATGTAC 
GACACCGCCC TGGAAAAGGG CAAGCTGGTC GATCTGGGCA ACAACGTCGA TGGCGCGCGC 
ATCGGCTTCG CGGTGCCCAG CTACGTCTTC GATGCCGGCG TCACCTCCGC CGAGGATCTC 
GACACGCCGG AAAACGCCGA GCGTTTCGGG CGTACCGTCT ACTCCATCGA GACCGGCACG 
GGCATGAGCG AGCAGCTCAA TGCCGGCGTC GCCAGCGATA CTTACGGCCT GGGCGACTGG 
GAGCTTTCCG AGACATCCAC GCCGGGCATG CTCGGCGCCG CCGACAGTGC CATCGACAAC 
CAGGAGTGGA TCGTCTTCGC CGGCTGGACG CCGCACTGGA TGAACATCAA GTACGACATC 
GCCTATCTCG ACGACCCCGA GGACTTGTGG GGAGAGGACG GCGGTCGCAG CGACGTGCGC 
ACCCTGGTCA CGAAGACATT CTCCGAGACG CACCCCAATG CCACCAGGTT GCTCGATCAA 
CTGGACTTCA CCGCCGACGA CCAGAGCGAC ATGATCCGTC GCTACGATCA GGACGGGATG 
CCCAAGGACG AAGCTGCCAT CGCCTGGATG CGCGACAACG CCGACAAGGT GGAAGGCTTT 
GTCGATGGCG TCACCACGCG TGACGGCGAG CCTGCCTGGC CGGTGGTGAA AGAAGCGTTC 
GACCTGTAG

Protein sequence

MMTASHPLAR GTKAALLGAC LAGLPLGMAQ AQDDTTDVRF SVPPWPGVTV KTELAAQLLD 
TLGYTPQQEQ LGTTITYQAL NQNELDAFLA GWLPAQQGMY DTALEKGKLV DLGNNVDGAR 
IGFAVPSYVF DAGVTSAEDL DTPENAERFG RTVYSIETGT GMSEQLNAGV ASDTYGLGDW 
ELSETSTPGM LGAADSAIDN QEWIVFAGWT PHWMNIKYDI AYLDDPEDLW GEDGGRSDVR 
TLVTKTFSET HPNATRLLDQ LDFTADDQSD MIRRYDQDGM PKDEAAIAWM RDNADKVEGF 
VDGVTTRDGE PAWPVVKEAF DL