Gene Haur_0966 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_0966
Symbol
ID	5732852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	1107370
End bp	1109499
Gene Length	2130 bp
Protein Length	709 aa
Translation table	11
GC content	52%
IMG OID	641278098
Product	hypothetical protein
Protein accession	YP_001543742
Protein GI	159897495
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000682742
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAACCA AACGTTCGTT GATCGCTATC GGGTTGGCGC TCGCTATCGC CTTGTTGAGT 
GTGTTTGCGG CTAGTAGCCT CACACCATCC AGCGCGGCAT CGTCGTCCGA TGGGCTATGG 
CAAGACGTTG CTGAACAACG GATTCAGCAA AAAGGCCAAC GTGATATCGT GCCGTTGGTC 
TACCGCACGG TCAGCCTCGA CCTCGCAGGT TTGAGCCAGC GTTTAGATCA AGCACCCTTG 
GAAAGTGCTG TGCAGGTACA GCAATCAGCA TTTTTGTTGA GCTTACCGCT GCCAAGCGGC 
CAATTTCGCC AATTTCGGGT GGTCGAATCG CCAATTATGG AGCCTGCGCT GGCGGCAAAG 
TTCCCTGAAT TGCGCACCTA CTTGGCACAA GGCTACGACG ACCCCGAAAT GGTTGCACGG 
CTTGATCTTA CGCCAAGCGG CTTTCATGGT TTGATCTTGG CTCCGGAAGG GCGCTATTTT 
ATCGACCCCT ACAGCCGCAA CGATACTGGC AATTATATTG TCTATGATAG CCGTAATTTT 
GTGGCCGACC CCAGCAAACT CGCCAGCAAA GGCAAGACCG ATTATGTTGG CGAAACTCCC 
ATCACCAACC CATTCCCTGA GCGCTATAGC ATTGGCGAAA CCTTGCGCAC CTATCGCCTC 
GCCATGGCTG CTACAGGCGA ATACACCAGT TTTCATGGTG GCACGGTCAA TGGAGCAATG 
GCAGCAATCG TAACTAGCGT CAATCGCGTT AATACCGTTT ACGAACGCGA TATCTCGGTA 
CGTATGGTGT TGGTTGCCAA CAATAACTTA ATTGTGTATA CCAATGGCGG CACTGACCCC 
TACACCAACG ACGATGGCTT TGAGATGCTG GGCGAGAATC AAACTAACCT CACCAGCGTG 
ATTGGTAACG CCAATTATGA TATTGGTCAC GTATTCAGCA CTGGTGGTGG CGGGGTTGCC 
GCACTTGGCT CAGTCTGTGT CTCAGGCTCA AAAGCTGAAG GTGTGACGGG TTCACCAGCT 
CCGGTTGGCG ATCCTTTTGA CATTGATTAT GTCGCCCACG AAGTTGGTCA CCAATTCGCA 
GGTAACCACA CCTTCAACGG TACAACTAAC GCCTGTGGCG GTGGCAATCG TGAAGGCCCA 
GCCGCCTACG AACCAGGCAG CGGCTCAACC ATTATGGCCT ATGCTGGGAT TTGTGGCTCG 
GAAAATCTGC AACCCAACAG TGATCCATAT TTCCATGTGA AAAGCTTGGA AGAAATGAGC 
GCCTTTATTA CAACTGGTGC TGGCGCAAGC TGTGGTACCA CGGCGGCCAC TGGCAACACG 
CCACCAACCG CTAACGCTGG CGCAGATTTC ACGATTCCTG CCAATACGCC GTTTGAATTA 
ACTGGCAGCG GCAACGATGT GAACGGCGAT AGCCTGACTT ACAATTGGGA GCAATACGAT 
TTAGGTTCAG CATCGCCACC GAATACTGAT AACGGCAATC GCCCAATTTT CCGTAGTTTC 
GATTCAACCA CTTCGACCAG CCGTAGCTTC CCACGCTTGA CCAATATTTT GAACAACTCG 
ACGACGATTG GTGAATCGAT GGCAACGACC AATCGCACCA TGAATTTCCG CCTAACCGTC 
CGTGATAATC GGGCTGGTGG CGGTGGTTAT GGCTTGGATA CAGCACGAGT TACAACCGTC 
AATACTGCTG GCCCCTTCCA AGTAACCGCG CCAAACACCG CCGTAACCTG GGCTGGCTTC 
AGCAGCCAAA GCGTTACTTG GAATGTTGCC AACACGACTG CTGCACCAGT CAATTGTAGC 
AATGTCAATA TTTTGTTCTC AAGCAATGGT GGTACGAGCT TTAGCCCAGT GCTGAGCAAC 
ACGCCTAATG ATGGCAGCGA GAGCATCACC GTACCAAACG TTGCTACCAC AACTGGTCGG 
ATCAAAGTGC AATGTGCTGG CAATGTTTTC TTTGATATTG GCAACGCCAA CTTCACGGTA 
ACCGCCAGCA ATGCCACGGT CACGCCAACC AGCGATGCCA CGGCAACCCC AACCATTACG 
CCAACGGCAA CCGCAACGGT TACCCCAAGC GTAACAGCTA CCCCAAGTAC ATCAATGGTC 
TACTTGCCAG TAGCCATGAA ACAACCCTAA

Protein sequence

MQTKRSLIAI GLALAIALLS VFAASSLTPS SAASSSDGLW QDVAEQRIQQ KGQRDIVPLV 
YRTVSLDLAG LSQRLDQAPL ESAVQVQQSA FLLSLPLPSG QFRQFRVVES PIMEPALAAK 
FPELRTYLAQ GYDDPEMVAR LDLTPSGFHG LILAPEGRYF IDPYSRNDTG NYIVYDSRNF 
VADPSKLASK GKTDYVGETP ITNPFPERYS IGETLRTYRL AMAATGEYTS FHGGTVNGAM 
AAIVTSVNRV NTVYERDISV RMVLVANNNL IVYTNGGTDP YTNDDGFEML GENQTNLTSV 
IGNANYDIGH VFSTGGGGVA ALGSVCVSGS KAEGVTGSPA PVGDPFDIDY VAHEVGHQFA 
GNHTFNGTTN ACGGGNREGP AAYEPGSGST IMAYAGICGS ENLQPNSDPY FHVKSLEEMS 
AFITTGAGAS CGTTAATGNT PPTANAGADF TIPANTPFEL TGSGNDVNGD SLTYNWEQYD 
LGSASPPNTD NGNRPIFRSF DSTTSTSRSF PRLTNILNNS TTIGESMATT NRTMNFRLTV 
RDNRAGGGGY GLDTARVTTV NTAGPFQVTA PNTAVTWAGF SSQSVTWNVA NTTAAPVNCS 
NVNILFSSNG GTSFSPVLSN TPNDGSESIT VPNVATTTGR IKVQCAGNVF FDIGNANFTV 
TASNATVTPT SDATATPTIT PTATATVTPS VTATPSTSMV YLPVAMKQP