Gene Csal_1970 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1970
Symbol
ID	4027210
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	2226196
End bp	2227308
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	65%
IMG OID	637967166
Product	mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
Protein accession	YP_574021
Protein GI	92114093
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1705] Muramidase (flagellum-specific)
TIGRFAM ID	[TIGR02541] flagellar rod assembly protein/muramidase FlgJ

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGTCG ATGGACTCAG CAATCAGTTC GCCCTCGATG TGCAGTCGTT GTCGCGCCTC 
AAGCACACGG CGAGCCAGTC GCCGGAGAAG GGCTTGTCCC AGGCGGCGGA CCAATTCGAG 
GCGATCTTTC TGCAGATGAT GCTCAAGAGC ATGCGCGACG CCATACCGCA GTCGGACCTG 
CTGAGCAGCA ACGAGACCGA TACCTATACC TCGATGCTCG ACAAGCAGTG GGCGCAGAAG 
ATGGCGGGGC ATGTCGGCCT CTCGGACATG CTGGTCGAGC AGCTTCAGGG GCGGGGCCTC 
GTGGGGCGCG ATGAGGAGGT GACGCGCAAC GACCTGATCG CGGGGATTCC CCGCGGCACG 
CCACGTGTCT TGAGCGATCC GATCGTGCCC CACGAGGCCG CCTCCAAGGA TTCAGGGCCC 
GGGGATGACG CCGTGACCTC GGCTTCCGGC GCTTCGTCCT CGAGCGCACC GTCGGAGGTG 
GCGACGAGTC GCGAGATGTC ACCGTCGAGT GCCGATATCG AGGACGCACG AGCGGCGCCG 
CACGTCGAGG CGTTCCTGTC GCGGCTGCAT GAGCCCGCCG AAGCCGCCGC CCGCGAAAGC 
GGTGTGCCGG CATCGTTGAT CCTGGCCCAG GCGGCGCTGG AAACCGGCTG GGGCGAGCGT 
GAGATTCCCG CGCGCGATGG CGGCAACAGC CACAACCTCT TCGGTATCAA GGCGACCGGT 
GGCTGGGATG GCGAGGCCAC CAGCATCACC ACCACCGAAT ATGTCGACGG TCGTGCCCGC 
CAACAGGTCG ACGAGTTCCG TGTCTACGAT TCCTTCGAAG CCGCGTTCAA GGATTACGCC 
GAGTTGATCG GCGGCAATCC ACGTTATGCC GGGGTGGTCA CGGCTTCGAC GCCGCAGAAC 
GCCGCCCGAG CTCTGCAATC CGGCGGCTAT GCCACCGACC CGAACTATGC CGACAAGGTG 
ATCGCCGTCA TGGCGCAGAT CGACGACCGT CTTGCCAGCG GGCCGACCCT GGCCAGCACC 
GCCGAGGTCA GCGAGTCGCA AGGCGGCGCG CCGACGCGCA ACGGTTCGTC GGATCCCTAT 
GATATATCGC GGATGCCCAC GGGAATTTTT TGA

Protein sequence

MSVDGLSNQF ALDVQSLSRL KHTASQSPEK GLSQAADQFE AIFLQMMLKS MRDAIPQSDL 
LSSNETDTYT SMLDKQWAQK MAGHVGLSDM LVEQLQGRGL VGRDEEVTRN DLIAGIPRGT 
PRVLSDPIVP HEAASKDSGP GDDAVTSASG ASSSSAPSEV ATSREMSPSS ADIEDARAAP 
HVEAFLSRLH EPAEAAARES GVPASLILAQ AALETGWGER EIPARDGGNS HNLFGIKATG 
GWDGEATSIT TTEYVDGRAR QQVDEFRVYD SFEAAFKDYA ELIGGNPRYA GVVTASTPQN 
AARALQSGGY ATDPNYADKV IAVMAQIDDR LASGPTLAST AEVSESQGGA PTRNGSSDPY 
DISRMPTGIF