Gene Csal_2067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2067
Symbol
ID	4026529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	2337075
End bp	2338097
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	67%
IMG OID	637967266
Product	glycoside hydrolase family protein
Protein accession	YP_574117
Protein GI	92114189
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.268597
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCAAC CCCTCGGCAC GGTCATGCTG GACATCGAAG GAACGCAGCT CGGCGATGAG 
GAACGTCGTC TGCTGGAACG CCCCGAGGTG GGTGGCGTGA TTCTGTTTGC ACGCAATACG 
CGTGATGCCG AGCAGGTACG CCGCCTGACG CGCGAGATTC GCGAACTGCG CCCCGACATG 
CTGCTGGCGA TCGACCAGGA AGGTGGTCGA GTGCAACGCT TGCGCGAGGG AGTGACGCGC 
TTGCCGAGCA TGGCCGCGCT GGCCGCCGGT TATGCCGACG CGCCCGATGA GGTGCGTTCG 
CGGGTACACG AGGCGGGGTG GCTGTTGGGT ATGGAAATGG CCGCCTGCGG CTTCGATGTC 
ACTTTCGCGC CGGTGCTCGA CGTGGACGAT CAGCGTTCGC CGGCGATCGG GGACCGCAGT 
TTTTCCGCCG ATCCGACAGT CGTGGCGGCT CTCGGCGAGG CCTTCATCGA AGGATTACAC 
GAGGCCGGCA TGGTGGCCGT GGGCAAGCAC TTTCCCGGCC ACGGCGGCGT CACCCTCGAC 
TCGCACCATG CCTTGCCCGA GGACAATCGG CCGTTGTCGG TTCTGCGCGA GCATGACCTG 
GTGCCGTTCA AGGCCCTCTC CGGCAAGCTG GATGCCATGA TGCCGGCGCA TGTCGTCTAT 
ACCGCGTTCG ATACACGTCC CGCGGGCTTC TCACCCTCCT GGCTGGGCAT GCTGCGCGAG 
GAAATGGCCT TCAAGGGCGT GGTGTTTTCC GATGATCTGA GCATGGCGGG GGCGCATGTG 
GCGGGCACCC CCGCGGCGCG TGCCGAGGCT GCTTGGTCGG CGGGGTGCGA CATGGTGCTG 
GTGTGCAACG ACCGCGCGGC GGCGCTCGAG ATCGTGGACG CCGCGGCCGG CCGGACCTCG 
AAGCGCCTGG GCAAGCTGCG CTACGGCCGC GCCCGTCCGG AACTGGAGAC GCTGCCGGCG 
CTGGCACGCT GGCGCCGTGC CCATGCACGC CTGGAAGCGC TCTCGGAAAC ACCGGCGAGT 
TGA

Protein sequence

MTQPLGTVML DIEGTQLGDE ERRLLERPEV GGVILFARNT RDAEQVRRLT REIRELRPDM 
LLAIDQEGGR VQRLREGVTR LPSMAALAAG YADAPDEVRS RVHEAGWLLG MEMAACGFDV 
TFAPVLDVDD QRSPAIGDRS FSADPTVVAA LGEAFIEGLH EAGMVAVGKH FPGHGGVTLD 
SHHALPEDNR PLSVLREHDL VPFKALSGKL DAMMPAHVVY TAFDTRPAGF SPSWLGMLRE 
EMAFKGVVFS DDLSMAGAHV AGTPAARAEA AWSAGCDMVL VCNDRAAALE IVDAAAGRTS 
KRLGKLRYGR ARPELETLPA LARWRRAHAR LEALSETPAS