Gene Haur_3034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3034
Symbol
ID	5734906
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	3831564
End bp	3833147
Gene Length	1584 bp
Protein Length	527 aa
Translation table	11
GC content	53%
IMG OID	641280178
Product	protein serine/threonine phosphatase
Protein accession	YP_001545800
Protein GI	159899553
COG category	[T] Signal transduction mechanisms
COG ID	[COG0631] Serine/threonine protein phosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCAAG CTGCCAATCT GCCTAACCTC GTGGTCTATG GGCAAAGCGA TGTTGGGCGA 
CAACGGAATA ATAACGAAGA TAATTTGGCA TGGCGACATG CCGATGAACG TAGTGTTGGC 
ACAAAATTGG TCAACGGGGT AACCGAACTT TTCGCCAAAA TTCGCGGCGG CGGGGCAACC 
GGGTTTAGTG TCAAAATCGA CCATAAATTG CTGGCCAGCC ACGGGCGGCT CTATGTCGTT 
GCCGATGGGG TCGGCGGTAA TGATGATGGC GAGTTGGCCA GCCGCGCTGT TGTCGAATAT 
ACGACCAAGT TTTTCTATAA TAGCGATCCC AAAAACTATA AAAGCAAACA AGATCAACTG 
AATGCGGCAA TTCAATATGC CACCAAAATG GTCTATAAAG AGGCCGGCAA TACCAATCGC 
GCCTCAACCT TGGTGTTAGC TTTGGTCTGG GATGAAGGCA CATTCCGCAA GATTATTTTC 
TCGAATGTTG GCGATAGCAA AGGCTATTTG TTCCGCGCCA ATAATACCGA ATATGATCGC 
GCCGTCCAAA CCAAAGATCA TGTCAACGCC ATGAACAAAA GCCTCTGGCA ATCGATGGGC 
GACCCCGAGG TAACGCCTCA CTTCAGCGAT GAGCTAGTTT TGGGCAAAGA TGATGTGATT 
GTACTCTGCT CAGACGGGCT TTCTGATGGG GTGCAGGCCG AGGAAATTGG CAAAATTGCC 
ACCCGCAATG CCCCACAAAA TGCGACAACT GAGTTAATTA GCCTTGCTAA TGAGCGCGGC 
GGCCACGATA ATATCACCAA TGTGGTGGTA CGCAACGGCC CTGCGCCCAT TCAATGGGGA 
GCCTTAGGCG GGATTCTCGG CGTTGTGCTG TTGGTTGCTG CTCTTTTAGG CGGGATTGTC 
TTCATCGGCG GCGATGATGT TAACCGGACA CAGGGTGGTC GCAACGCGAT CATGATTCCA 
ACCCGACCAA TCATCACCAT GGTCGATGGT TCGTTTGCCA CGGTTACTTT ACCTGCTGAA 
ACGGCAACAG CCGAAGCCGA ATTGATTCGG CAAGCAACCG AAAACCCAGT GCCAACCGAT 
ACTCTTGGGC CACAGGCAAC CAGTGTGCCA GGCACAAACC CAACAGCACG GCCAGCCGCC 
ACGGCAACCA ACCGCCCAGC GGCCAATAAT CCAACGCCAA TTCCAGCAAC CAACCCGCCA 
GCTGTTCAGC CAACCAATCC ACCAGTGGTC ATTCAACCAA CCAATCCACC AGCCCCAGGC 
GATCGCGATG GCGATGGTGT AACTGATGAC GTTGATCCAT GTCCCGATGT GGCTGGACCA 
AACAATGGCT GTCCAGCGCC AGTTGAGCCA ACCGCACCCC CAGCAGTTGT TGATACCGAT 
GGCGATACGA TTCCCGATAA TGTTGATGAT TGTCCAAATG AGCCTGGTGA TCCGTCGCGG 
AATGGTTGTC CCAAGCCAGT TGAGCAGGCT ACTAATACAC CAAAACCGCC AACCGATACG 
CCACGGCCAA CCGATACGCC TCAGCCAACG GCTGTGCCAA CGTCACCAAT TAATCCAAAT 
GATCCACCAA CACCACGTCC GTAA

Protein sequence

MSQAANLPNL VVYGQSDVGR QRNNNEDNLA WRHADERSVG TKLVNGVTEL FAKIRGGGAT 
GFSVKIDHKL LASHGRLYVV ADGVGGNDDG ELASRAVVEY TTKFFYNSDP KNYKSKQDQL 
NAAIQYATKM VYKEAGNTNR ASTLVLALVW DEGTFRKIIF SNVGDSKGYL FRANNTEYDR 
AVQTKDHVNA MNKSLWQSMG DPEVTPHFSD ELVLGKDDVI VLCSDGLSDG VQAEEIGKIA 
TRNAPQNATT ELISLANERG GHDNITNVVV RNGPAPIQWG ALGGILGVVL LVAALLGGIV 
FIGGDDVNRT QGGRNAIMIP TRPIITMVDG SFATVTLPAE TATAEAELIR QATENPVPTD 
TLGPQATSVP GTNPTARPAA TATNRPAANN PTPIPATNPP AVQPTNPPVV IQPTNPPAPG 
DRDGDGVTDD VDPCPDVAGP NNGCPAPVEP TAPPAVVDTD GDTIPDNVDD CPNEPGDPSR 
NGCPKPVEQA TNTPKPPTDT PRPTDTPQPT AVPTSPINPN DPPTPRP