Gene Acid345_0602 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0602
Symbol
ID	4069635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	733007
End bp	734215
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	60%
IMG OID	637982607
Product	glycosylasparaginase
Protein accession	YP_589681
Protein GI	94967633
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1446] Asparaginase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.982987
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGTTTT CCCGCCGTGA ATTTATCGCG ACGTCTGCAA TTGGTTCGGC TTCTCTTGCA 
CTTGATCTGA ATGCGCAATC CAACAATGCT CCTAAGGCTG CCGGGCCGGG GAAGAACATC 
CTGATTTGCT CGGCGAATGG TCACAATTAT CTCGATCGCG GACACGCCGT ACTGGAGAAG 
GGCGGCGACA CGCTGGACGC GATCATGGAA GTGGTTCGCG GGCCGGAAGA AGATCCGGAA 
GACGACAGCG TAGGTTACGG CGGGTTGCCG AACGAAGAAG GCGTGGTCGA ACTCGATTCA 
TGTTGTATGC ATGGACCAAC GCGGCTCGCC GGATCTGTCG GTGGCGTACA CGACATCATG 
CATGTGGCTC TGCTGGCGAA GACAGTGATG GAGCACACCG GGCACGTGAT GCTGGTTGGC 
GAAGGCGCGA AGCGTTTTGC GGTCGCGCAC GGCTTCCCAA CGATGAACCT GCTCACTGAG 
CACTCGCGCA AAGTCTGGCT GCTGTGGAAG GAGACAAATT CCAATCAGGA CTGGTGGGGG 
CCAGGACCGG CGAGCCCGCA CTTCAAGTTC CCGACGAATG GAACGAAGTC GGAGGACCTG 
AAAGAACGTA TCCGTGAGAT GGAAAAGCTG GCGGAGCAGA TCGGAATCGA GCCGGAGCGG 
CGGATGGCGG CGATCCATCG CGTTCTGTAT CCACCGACGG GCACGATCAA CTGCTCGGCG 
CTGAAGGCGA ACGGCGAGAT GAGCGGCGCC ACCACAACCA GCGGACTGGC GTGGAAGATC 
CCTGGGCGCT GCGGTGATTC GCCGATCATC GGCGCGGGCT GCTACTGCGA CCAGGACGTG 
GGTTCTGCGG GAGCGACGGG CAGCGGCGAA GAGAACATCA AGATCGCCGG CGCGCACACG 
ATCGTGGAGA ACATGCGCCA TGGCATGTCG CCAAAAGAGG CGGGCATGGA TGCGCTGAAG 
CGGATCGTGC GGAACTATAA CGGGGACATG GCGCGCCTGA AGTACGTGAG CATGAAGTTC 
TACATCCTGC GCAAAGACGG CGAGCATGCC GGCGTTTCGA TGTGGAGCGG GACGAAAGAA 
GCTCCGTCGA AGTTCGCGAT CCACGATGGG ACGGCGCGGT TCGAGAATGC GGCGTACCTG 
TATGAAGGCG AGCCGCAGGA GTGGCCGCCG ATGCCGGAGT TGCAGACTTC GACGTATTCG 
ACGCTTTAG

Protein sequence

MKFSRREFIA TSAIGSASLA LDLNAQSNNA PKAAGPGKNI LICSANGHNY LDRGHAVLEK 
GGDTLDAIME VVRGPEEDPE DDSVGYGGLP NEEGVVELDS CCMHGPTRLA GSVGGVHDIM 
HVALLAKTVM EHTGHVMLVG EGAKRFAVAH GFPTMNLLTE HSRKVWLLWK ETNSNQDWWG 
PGPASPHFKF PTNGTKSEDL KERIREMEKL AEQIGIEPER RMAAIHRVLY PPTGTINCSA 
LKANGEMSGA TTTSGLAWKI PGRCGDSPII GAGCYCDQDV GSAGATGSGE ENIKIAGAHT 
IVENMRHGMS PKEAGMDALK RIVRNYNGDM ARLKYVSMKF YILRKDGEHA GVSMWSGTKE 
APSKFAIHDG TARFENAAYL YEGEPQEWPP MPELQTSTYS TL