Gene Acry_0120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_0120
Symbol
ID	5159461
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009484
Strand	-
Start bp	132301
End bp	133428
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	68%
IMG OID	640552036
Product	glycosyl transferase family protein
Protein accession	YP_001233267
Protein GI	148259140
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID	[TIGR03469] hopene-associated glycosyltransferase HpnB

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCTGC TTGCCCTGCT CGCGCTGCTG GCTTGGATCT ACCTATATCT GCTGCACGGC 
CAGTTCTGGC AGAGCGGCCC GGAACTCGCC CCGGCGCGGC CGGCAACCGC GGTTCCGGTA 
GACATCATCG TGCCGGCGCG CGACGAGGCG GAAACGATCG GGGCGGTCGT GCAATCGCTG 
CTGGCTCAGG ATTATGCCGG GCCGTTCCGG GTGATCCTGG TCGACGATGG CAGTACGGAT 
CGTACAGGCG ACATCGCGAT CCGGGCGGCG AACGGCGATC CGCGCTTTGC CCTGCTGCGC 
GGCGGCGAAA AGCCAGCCGG CTGGTCGGGC AAACTCTGGG CATTGGAGCA GGGAGTGGCG 
CACGGCGCGG CGCCAGTGCT GCTGTTCACC GATGCCGATA TTGTTCACGA TCCGCGGCAT 
CTGGCGACGC TGGCCGCGAG GTTGGTGACA CCGGAGCGCG GCGCGCGGCT CGACATGGTT 
TCGGAAATGG TGCGTCTGAA CTGCGAAAGC GCCGCCGAAC GCGCGCTGGT GCCGGCTTTC 
GTCTACTTCT TCCAGATGCT CTACCCGTTC GCCCGCGTGA ACGATCCGCT CGACGGCACC 
GCCGCCGCGG CCGGCGGCAC GGTGCTGATC CGGCGCGAGG CGCTGGAGCG GGCTGGCGGG 
CTCGCGGCGA TGCACGGCGC GCTGATCGAC GACGTCACGC TGGCCGGCCG GGTCAAGCGC 
GGCGGCGCCG TGTTCCTCGG GCATTCCGGC CTCGCTCGCT CGATCCGCCC CTATCCGCGG 
CTTGCCGACA TCAGGGCGAT GATCTCGCGC ACTGCCTTTA CCCAGCTGCA TTATTCCGGG 
CTGCTGCTCG CGCTCACGCT GGCTGGGCTG GCGGTCGTCT GGCTGGTGCC GCCGCTTGCC 
CTCGTTTTCG GGCATGAAGT CGCGGCCTTG TGCGGGCTGA TTGCCTCGCT GCTCGCGGTG 
CTGAGCTATC AGCCGACGCT GCGGCGCTAC GGACGCGGCT GGTATTGGGG GCTGGCACTA 
CCGCTGATCG CGCTTGTCTA TATGGAGGCG ACGTTGGCCT CCGCACTGCG CTATTGGCGT 
GGCACGGGGG CTGCCTGGAA AAGCCGCGAT TATGGAGCCG ACGCATGA

Protein sequence

MTLLALLALL AWIYLYLLHG QFWQSGPELA PARPATAVPV DIIVPARDEA ETIGAVVQSL 
LAQDYAGPFR VILVDDGSTD RTGDIAIRAA NGDPRFALLR GGEKPAGWSG KLWALEQGVA 
HGAAPVLLFT DADIVHDPRH LATLAARLVT PERGARLDMV SEMVRLNCES AAERALVPAF 
VYFFQMLYPF ARVNDPLDGT AAAAGGTVLI RREALERAGG LAAMHGALID DVTLAGRVKR 
GGAVFLGHSG LARSIRPYPR LADIRAMISR TAFTQLHYSG LLLALTLAGL AVVWLVPPLA 
LVFGHEVAAL CGLIASLLAV LSYQPTLRRY GRGWYWGLAL PLIALVYMEA TLASALRYWR 
GTGAAWKSRD YGADA