Gene Acry_3372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_3372
Symbol
ID	5159198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009468
Strand	+
Start bp	88134
End bp	89282
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	61%
IMG OID	640538692
Product	HipA domain-containing protein
Protein accession	YP_001220125
Protein GI	148243886
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGACC ACACGCCGGT TTTCTATGAG ACCCTGCTGG TTGGTATGAT CCATACGGAC 
ACCAGGGGCT CTTGCTTCAC CTATGACGAG AGCTGGCTGT CACGGACAGG CAGCTTCCAG 
ATCTCACTCA CCATGCCGCT TGGCCGCCCA GCGGTGGAGC ACCATGTCAT CATGCCATGG 
CTGGCAAACC TGCTGCCAGA AGGCGATGCC ATCAGTACGA TCGCGAGGCG GTCCGGAATA 
GCCACCGGCG ATATTCTCAG CCTCCTCATG GTCGTCGGCA GGGACACCGC GGGCGCGTTG 
AGCATTGGTC AGCCTCGCAG CCGCGAGGGG CGCCATTATA TGACGATCGC CGGTCAGGAC 
GCGCTGGAGC GGCTCATCGA AGATTTACCG CGCCGGCCGT TGCTGTCGGG AGATGACGGC 
GTCTCGATGA GCCTGCCCGG CGCGCAGGAG AAATTGCCCG TCGTTCTCAA TGACAACGAT 
ATTGCGCTTC CGCTAAACGG GGCGCCGTCA ACCCACATCA TCAAGCCCAA CAACCGAAGA 
CTGCCAGGCA GCGTTCAGAA CGAGGCACTC TGCATGGTTC TGGCACGACG GGTTGGGCTC 
GATGTGGCCG ACGTCACCAC CGGCCAGGCC GGCAAGCGCT CCTATCTTCT GGTTGAGCGC 
TATGACCGGA TCCAGCGTGG CGGCGTGTGG CGCCGGCTAC ACCAGGAAGA TTTCTGCCAG 
GCACTGTCGC TACCTCCGGC GTCGAAGTAC CAGCACAACA GAACGGGTAT CCTTGGGCCA 
GGACTGGCCG ACCTCTTCCG GACCGTCAGG ACTTTCATGA CGGCGCGCGA TACGATCAGG 
CTTCTCGATG CGGTTATCTT CAACGTGCTG ATCACGAACG TCGATTCCCA TGCGAAGAAC 
TATTCGATCA TGTTGACTGG GCGTGCCCGG CTCTCGCCAC TTTACGATCT GATGGCCGGC 
GATGCGTGGT CCGAGGTTAC CCAGAATCTC CCTCAGGACA TCGGCGGCAA GAACCGCGGC 
CAATACATCA ATCATTTGCA CTGGCGTCGG ATGGCGGAGG AATCAGGTCT CAGCGCCGGC 
GCCGTTGTCC GGCGGGTGAT CCAGATGGCA ACGGCCCTTC CATCCATGCT CGATCAGGCG 
GTTGATTAG

Protein sequence

MSDHTPVFYE TLLVGMIHTD TRGSCFTYDE SWLSRTGSFQ ISLTMPLGRP AVEHHVIMPW 
LANLLPEGDA ISTIARRSGI ATGDILSLLM VVGRDTAGAL SIGQPRSREG RHYMTIAGQD 
ALERLIEDLP RRPLLSGDDG VSMSLPGAQE KLPVVLNDND IALPLNGAPS THIIKPNNRR 
LPGSVQNEAL CMVLARRVGL DVADVTTGQA GKRSYLLVER YDRIQRGGVW RRLHQEDFCQ 
ALSLPPASKY QHNRTGILGP GLADLFRTVR TFMTARDTIR LLDAVIFNVL ITNVDSHAKN 
YSIMLTGRAR LSPLYDLMAG DAWSEVTQNL PQDIGGKNRG QYINHLHWRR MAEESGLSAG 
AVVRRVIQMA TALPSMLDQA VD