Gene Acry_2964 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_2964
Symbol
ID	5159819
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009484
Strand	+
Start bp	3244178
End bp	3245659
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	68%
IMG OID	640554894
Product	lipopolysaccharide biosynthesis protein
Protein accession	YP_001236073
Protein GI	148261946
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3206] Uncharacterized protein involved in exopolysaccharide biosynthesis
TIGRFAM ID	[TIGR03007] polysaccharide chain length determinant protein, PEP-CTERM locus subfamily

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACAGC TCATCGAAAC CGCACTGCGG CTGCTCGCCA CCGCCTGGCG CAAGCGCTGG 
TACGCGCTCG CCACCGCGTG GCTCGTCTGC GCGCTCGGGT GGACGGCGGT CATGCTGCTG 
CCGCCGAATT TCGAGGCCAG CGCGCAGCTC TACGTCGCGG CCGACCCGGT GCTGACGCCG 
CTGCTGCGCG GCATCGCCAT CAACGGCAAT TCCGAACAGG AATTCAACCT GCTCCGCCAG 
ACGCTGCTCA GCACCCCCAA TCTCCAGCAC CTGATCGACC GCGAAGGGCT GCACGCGCAG 
GGGCCGGGTG CGCGCGAGGC GCTGGTGCGC CGGCTGCGGG CGCGGGTGAC CGTGGTGCCG 
CAGAGCCGCA ACCTGTTCAC CATCCGCTAT GTCGGCCACG ATCCGCGGCG CGCCTACAAC 
ATCATCGCCG GTCTGGTGAA CATCTATGTC GAGCGCGCGT CGGACCACAA CCAGAGCGAC 
ATCGACAATG CCGGCAAGTT CCTGCAATCG CAGATCGACT ATTTCCACAA CCAGCTGAAA 
TCGCTCGAAG CGCGCCGCGC GGCGTTCCAG GCGAAATATC TCGAACTGCT GCCGGGCAGC 
GACGGCGTTT CCGCCGTGCG GGCATCGGGC GCGCGGGTCC GCAAGCTGGA GACCGAACTG 
CAGGACGCCA AGGCCGAGCA GGCGCTGCTG GCCAGCGAAC TCGCCAAGAC CAAGCCGCTG 
CTGTCGGAAA CCCAGGCCGC CGGCGGCAAC CCCGCGCTCG CCGCGGCCCT CGCCAACCTG 
GCCAGGCTGC GCCAGCAATA CACCAACAGC TATCCCGGCG TGCAGGCGGC CGAACGGCAG 
GTCAAGGCGC TCGAACACGG GCCGGCCGGC GGCGGCAAGT CCAGCTACAG CGTGCCGGTC 
GCCAATCCGG TCTACAAGGC GCTGCATCTC GAGATCCTGC AGACGCAGAC CAGGATCCTC 
GAGACGACCC GCGCGCTGGC GCGCGCCAAG GTGGAGCATG CGAAGCTGAC CGCGCTCGCC 
CGTTCGGCGC CCGGCGTCGA GGCGAAGTTC ATCAACCTCA ACCGGAATTA CGGTGTCCTG 
CAGAAGGAAT ATCAGGACCT GATCAGCCGG CGCGAGGCGA TGCGCATCGG CGCCGCCGCC 
AATATCGATG CCAACCAGGT GCAGCTGCAG GTGATCAATC CGCCGGTTCT GCCCCGGCTT 
CCCATCGGGC CGAACCGGCG CCTGTTCCTC GTCGCCGTGC TGGTCCTCGG CATCGGTGCG 
GGCCTCGGCG TCGGCGTGTT GCTCGGCGAA CTCGAGGGCC GCGTCCGCTC CGAGGCGGAT 
CTGCGCGGCT TCGGCATCCC GGTGATCGGC CAGATTTCCG ACATCTCGCC GCAATCCGGC 
GTGATCATGC CGGCGCTGCG CATCGGCATC GGCGGTTCGC TGCTCCTGGG CGTGTTCGGC 
GCGCTCTTCA TTGCGACCTT CATCATCGGG GGGCTCGGAT GA

Protein sequence

MEQLIETALR LLATAWRKRW YALATAWLVC ALGWTAVMLL PPNFEASAQL YVAADPVLTP 
LLRGIAINGN SEQEFNLLRQ TLLSTPNLQH LIDREGLHAQ GPGAREALVR RLRARVTVVP 
QSRNLFTIRY VGHDPRRAYN IIAGLVNIYV ERASDHNQSD IDNAGKFLQS QIDYFHNQLK 
SLEARRAAFQ AKYLELLPGS DGVSAVRASG ARVRKLETEL QDAKAEQALL ASELAKTKPL 
LSETQAAGGN PALAAALANL ARLRQQYTNS YPGVQAAERQ VKALEHGPAG GGKSSYSVPV 
ANPVYKALHL EILQTQTRIL ETTRALARAK VEHAKLTALA RSAPGVEAKF INLNRNYGVL 
QKEYQDLISR REAMRIGAAA NIDANQVQLQ VINPPVLPRL PIGPNRRLFL VAVLVLGIGA 
GLGVGVLLGE LEGRVRSEAD LRGFGIPVIG QISDISPQSG VIMPALRIGI GGSLLLGVFG 
ALFIATFIIG GLG