Gene Paes_2172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_2172
Symbol
ID	6458675
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	+
Start bp	2345733
End bp	2346860
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	54%
IMG OID	642726148
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_002016821
Protein GI	194334961
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGA AAGCACTCCT CTCACTCCTC GTTCTGCTTA TCACAAACAT ACTCTCCGCC 
TGCGCTTCCA ATCAGCAGGC AGAGGATGGT ATCGATGCAA AAATCGGCAG GATGATCATG 
GTCGGATTCC GCGGAATGTC GATTGAAGAG GCTCCGTGGA TCAGCGACGA TATCGCCAGC 
AAGAGAATCG GGGGAGTGAT CCTCTTCGAT TACGACGTTC CTTCGGCATC GACGACGAGA 
AACATCGCAT CGCCCGGCCA GCTTGCCGCA TTGACCCGTC AACTCCAGGA GTGTTCCCCC 
GAACCGCTTC TGATCGCCAT CGATCAGGAA GGCGGCAGAG TTTCACGACT GAAACCCTCC 
CGGGGATTTC CCGAAAGCGT TTCAGCGGCG CATCTTGGCG CCGTCAACGA TCCCGACAGC 
ACCTTGCGGA GCGCAGCAAC AACTGCGGCA ACGCTGCAAT CGATGCACAT CAACCTGAAC 
TTCGCCCCGG TAGCTGATGT CAATATCAAT CCGGACAACC CCGTCATAGG CCGTCTGGAA 
CGAAGCTTCT CGTCCGACCC TGCAATCGTC GCATTGCATG CGGCAGCAAC AGTACAGGCC 
ATGCACGAAG CAGGGATCCA TACTGCGCTG AAACACTTCC CCGGCCACGG CAGTTCAACA 
ACCGATACCC ATAAGGATTT CACCGACGTC ACCACCACCT GGACGCCGAA AGAACTCGAT 
CCCTACAGGG CACTCATCAA AGAAGGATAC CGCGATTTCA TCATGACTGC GCATGTATTC 
AACGCTCAGC TCGACCCTGA TTATCCGGCA ACACTGTCAC AGAAAACCAT CACCGGCATG 
CTTCGCGACT CGCTCGGCTT CAGGGGCGCT GTCATCAGTG ACGACATGCA GATGCAGGCT 
ATAGCCGCCC ATTACGGGCT CGAAACAGCT ATCAGGCTGG CTCTCGATGC TGGAGTTGAT 
ATTCTGCTCT TCGCCAACAA TTCGACCTAC GACCCCGATA TTGGGAGGAA AACATTTACA 
ATCATCAAAA CACTCGTCGA TAACGGCACC ATCAGCAGGA AACGGATCGA AGAATCGTGG 
GAGCGGATCA ATACCATGCA ACACAACCTT TTACCGGCAG AACAATGA

Protein sequence

MKKKALLSLL VLLITNILSA CASNQQAEDG IDAKIGRMIM VGFRGMSIEE APWISDDIAS 
KRIGGVILFD YDVPSASTTR NIASPGQLAA LTRQLQECSP EPLLIAIDQE GGRVSRLKPS 
RGFPESVSAA HLGAVNDPDS TLRSAATTAA TLQSMHINLN FAPVADVNIN PDNPVIGRLE 
RSFSSDPAIV ALHAAATVQA MHEAGIHTAL KHFPGHGSST TDTHKDFTDV TTTWTPKELD 
PYRALIKEGY RDFIMTAHVF NAQLDPDYPA TLSQKTITGM LRDSLGFRGA VISDDMQMQA 
IAAHYGLETA IRLALDAGVD ILLFANNSTY DPDIGRKTFT IIKTLVDNGT ISRKRIEESW 
ERINTMQHNL LPAEQ