Gene Haur_1843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1843
Symbol
ID	5733732
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	2143464
End bp	2144597
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	53%
IMG OID	641278987
Product	hypothetical protein
Protein accession	YP_001544614
Protein GI	159898367
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCGTTA TTGGTAATCC ACATGATCGG CGAGTTGCAC TGTGGCAGGC GGCCTTGGCC 
CGTCAAGGCC AGCCGCCAGC TTGCGTCATT AGCTATTACG ATCTGTTGGC AGGCCAACAC 
GATTTGGCTG AGTTGATCAA ATCTAGTGAG CTAGTGCGGA TTGAATCGCC TGGCAAGGAT 
GAGCAACTGT ATCGTGAACT GGTACGGTTC GCTGCTGAAC TAACGCCTGA ACCAGAGTTT 
GAGCATTGGC CGATCGATGC AAATTTGCCG CAAGAGCGCG GGCGCTTGTG GGGTAGTCGC 
CAATGGTATC GCGGCTACAC CCGCTTACTA AGCCAACTTG GGCAACAATT AGCTAGCTTA 
AATGTACGCT TGTTGCAGCA CCCTGCCGAT ATCAGCGTGA TGTTCGATAA AGTGGCCTGC 
CATGCGCGAT TGGCGCAAGC CGATGTGCTT GTGCCACGCA GTTTGCCAGC GATTGGCTCG 
TTTGAACAAT TGCAAACAGC ACTACAAACT CATGGCTGGC AACGGGTTTT TATCAAACTG 
GCGCATGGCT CAAGCGCGGC GGGCGTGGTG GCGTATCGCA CTAATGGCCG CCAAATGCAG 
GCAATTACCA CGGTTGAGTT GGTCGAAACC AGCGCTGGCT TGCAATTGTA CAACTCACGC 
AATTTGCGCA CCTACACCCA TCTGCGCGAA ATTCAACCAT TAATTGATGC CTTGGCCCAA 
CAACGAGTCC ATGTTGAAGA ATGGGTTCCC AAGGCGCGGC TGGCGGGCAA GGTCTACGAT 
TTGCGCATGT TGGTGATTGC GGGCAAAGCG CAACATACGG TTGTGCGCAC CAGCACTTCG 
CCAATCACCA ACCTGCATCT ATTGAATCCA CGCGGCGATT TGGCGGCAGT TCAAGCCCAG 
TTAGGAGCCG AATTTTGGCA GATTGTGCGG CAACAGGCCG AAGCGGCTAG CGCCTGTTTT 
GAGCGCTCGC TTTACGCTGG GGTTGATTTG CTGATCGCCA ATAGCCTGCA ACATTGTTTG 
GTTGGCGAAG TTAATGCCTT TGGCGATTTG CTACCAAATG TCTTGGTCGA TGGACTCGAT 
AGTTATGAGG CTGAAATAGT GGGGGCTGGT AGTTGGTGGT CGGGGATCAG GTAA

Protein sequence

MIVIGNPHDR RVALWQAALA RQGQPPACVI SYYDLLAGQH DLAELIKSSE LVRIESPGKD 
EQLYRELVRF AAELTPEPEF EHWPIDANLP QERGRLWGSR QWYRGYTRLL SQLGQQLASL 
NVRLLQHPAD ISVMFDKVAC HARLAQADVL VPRSLPAIGS FEQLQTALQT HGWQRVFIKL 
AHGSSAAGVV AYRTNGRQMQ AITTVELVET SAGLQLYNSR NLRTYTHLRE IQPLIDALAQ 
QRVHVEEWVP KARLAGKVYD LRMLVIAGKA QHTVVRTSTS PITNLHLLNP RGDLAAVQAQ 
LGAEFWQIVR QQAEAASACF ERSLYAGVDL LIANSLQHCL VGEVNAFGDL LPNVLVDGLD 
SYEAEIVGAG SWWSGIR