Gene Clim_2414 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2414
Symbol
ID	6355885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	2644223
End bp	2645344
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	54%
IMG OID	642670004
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_001944414
Protein GI	189347885
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATACAAA AAACACTCTT TGCCGCTCTC TTCATCTTCA TGCAGCTCTC TTCGCTTCCA 
GCGCAGGCCG CTGCTCCAGT TGACAGTCTT TCCATAAAAA TCGGCCAGAT GCTTATGATC 
GGGTTCCGGG GGCTGACAGC GAAAGCGCCC GGAATAGCTG ACGATATCCG CAAGCGTCAT 
ATCGGCGGCG TGGTGCTATT CGATTATGAT GTACCATTGA AATCACCGGT ACGGAATATC 
GCTGGCCCCG AGCAGCTGTC GAAACTAACG CGTGAGCTGA TGGATCTTTC GGAAATCCCG 
CTGTTCATCG CGCTTGACCA GGAAGGCGGA AAGGTGAACC GTCTGAAAAC CTCAAAGGGA 
TTTCCCCCCT CGGTTTCAGC TGCACACCTC GGCATGCTCG ATAACCCGGA CAGCACAACC 
GCCGCAGCGC GACAGACCGC CGCGACGCTG AAAAAAATGC ACCTGAACAT GAACCTTGCG 
CCGGTGCTCG ACCTGAACAC CAATTCTGAG AATCCGGTCA TCGGCAAACT TGGTCGCAGC 
TACTCCGCTG ATCCTGCAGT CGTCACGCGT CATGCCGGGC TGACGGCGAG AGTTTTTCGT 
GAAGAGGGAA TCATTCCGGT CTTCAAACAC TTTCCGGGGC ACGGCAGCTC AACAACGGAC 
TCCCACAAGG GCTTCACGGA CGTTACCGCA AGCTGGACGA AAAAAGAGAT TGAACCGTAC 
CGTTCGTTGA TCGCGGCCGG CTACGACGAT GCCGTCATGA CAGCTCATGT GTTCAACAGG 
CAGCTTGACG ACCGCTATCC GGCCACACTT TCGCAGAAGG TACTGAACGA CCGTCTGCGC 
AGCAGACTCC GCTTCGACGG AGTTATCCTG AGCGATGATA TGCAGATGAA AGCCATTGCC 
GACCAGTTCG GACTTGAAGA TGCCATCAGA CTGGCTCTCG ATGCAGGAGT GGATATCCTG 
ATCTTTGGCA ACAACACCAC ATTCGATCCC GCAATTGCTG AAAAAGCCAC AGCAATCCTC 
CATGAGCTTG TACAAAACGG TACGGTAAGC CGAGCCCGTA TTGACCGCTC CTACCGGAGA 
ATCATGGCTC TCAAGGAACG CTACCTCTAC CACTGCAAAT AA

Protein sequence

MIQKTLFAAL FIFMQLSSLP AQAAAPVDSL SIKIGQMLMI GFRGLTAKAP GIADDIRKRH 
IGGVVLFDYD VPLKSPVRNI AGPEQLSKLT RELMDLSEIP LFIALDQEGG KVNRLKTSKG 
FPPSVSAAHL GMLDNPDSTT AAARQTAATL KKMHLNMNLA PVLDLNTNSE NPVIGKLGRS 
YSADPAVVTR HAGLTARVFR EEGIIPVFKH FPGHGSSTTD SHKGFTDVTA SWTKKEIEPY 
RSLIAAGYDD AVMTAHVFNR QLDDRYPATL SQKVLNDRLR SRLRFDGVIL SDDMQMKAIA 
DQFGLEDAIR LALDAGVDIL IFGNNTTFDP AIAEKATAIL HELVQNGTVS RARIDRSYRR 
IMALKERYLY HCK