Gene Haur_3356 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3356
Symbol
ID	5735226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	4233826
End bp	4235133
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	52%
IMG OID	641280503
Product	polysaccharide pyruvyl transferase
Protein accession	YP_001546120
Protein GI	159899873
COG category	[S] Function unknown
COG ID	[COG2327] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGTTT TATTATTGAA TGCCCATTCG CCGCAAAATG CTGGCGATTT GGCCTTACTT 
GAGCAATCGT TGGCCCATTT ACGAGCCGCG TTTCCCCATG CCGATTTGAG CTATGTGATC 
AATCAGCCTG ATCCGCCGCA ATGGCTGCCT GCTGATGTTC CCTATATTTT GTCGATCCAT 
GAGCATAAAA CCAATTTGAT CAAAGATGCA CCCAAGCCAC GGCGTAAATG GCTGATGCTG 
GGGCTGGCAA TCTGGTTGGT TGGCATCAGC CTGATCTATC GCTGGACAGG CATCAAACTC 
AAGCCAGCCA AAACCAGCGA TTGGCGTGAA TTACTTGAGC ATTATTTTGA GGCCGATGTT 
ACGGCAGCGA TTGGCGGCGG CTATTTGTAT GCGACCAAAG CCTTCGACCT GAACTACATT 
TGGGTGTGGT TGGGCGTGGC CTTGCCCGTG CTCATGGGCA AGCCGCTAGT AATGTTGCCG 
CAATCGTTTG GGCCGGTCAC TGGCAAAATC AACCAACTGC TGTTGGCATG GTTGGTCAAT 
CGCTCAGTCC AAGCCTATGC CCGCGAAGAA CGTTCGCAGC ACTATCTCTA TAGCATCGGG 
GTTAATCAAT CAGTTCAGGT TGTGCCTGAT GTCGCCTTCA ACTGCCCAAC CGTCGAGCCA 
GCCCAAGCCG AGCACTATTT GGCCCGTTGG TGGCAACCAG CCAAACGCCC TGCTTTAGTC 
GTTGGCATCA CGGCGATGGA TTTTGGCATT CAGCACCCAG GCTCGGGGTT TAGCCATGGC 
CAACGTTATG AGCAAGCCTT GCTCGATTTG ATTCAACATA TCGGCCAGTG TGATGATGTG 
CATATCTTGC TGTTTGCCCA ATGCGTTGGG GCCAGCGAGG CTGAGGATGA TCGCGTGGTG 
GCGCGGCGCT TAATCGCTCA ACTGCCAGCC ACTACGCCAA TCACTTTTAT TGATGATCGC 
CTGCAACCAG CCATGCTCAA ACAACTCTAC AGCCAGATTG ATCTACTGAT TGCAACGCGT 
TTGCATTCGG CAATTTTCGC CTTGAGTACG GCCACACCCA GCTTTGTGAT TGGCTATTTG 
CACAAATCGG CAGGCGTGAT GCACATGCTT GGCTTGGCTG ATTACCAAAT TCCGATTGAA 
TCGATCGATA GCAGCAACAT TATTAGTGCC TTTGAACAAA CCCTCGCTGC CCGTGGCTCG 
ATTAAAACCA TGATGCGCAG CAGCATTCCC GCCTTGCAAA GCCAACTTGA ACGTTTGCCC 
AAGCAGATTC GGGCGGCGGT TGGCGATTGG TTACGAGGAG CAAAGTAG

Protein sequence

MKVLLLNAHS PQNAGDLALL EQSLAHLRAA FPHADLSYVI NQPDPPQWLP ADVPYILSIH 
EHKTNLIKDA PKPRRKWLML GLAIWLVGIS LIYRWTGIKL KPAKTSDWRE LLEHYFEADV 
TAAIGGGYLY ATKAFDLNYI WVWLGVALPV LMGKPLVMLP QSFGPVTGKI NQLLLAWLVN 
RSVQAYAREE RSQHYLYSIG VNQSVQVVPD VAFNCPTVEP AQAEHYLARW WQPAKRPALV 
VGITAMDFGI QHPGSGFSHG QRYEQALLDL IQHIGQCDDV HILLFAQCVG ASEAEDDRVV 
ARRLIAQLPA TTPITFIDDR LQPAMLKQLY SQIDLLIATR LHSAIFALST ATPSFVIGYL 
HKSAGVMHML GLADYQIPIE SIDSSNIISA FEQTLAARGS IKTMMRSSIP ALQSQLERLP 
KQIRAAVGDW LRGAK