Gene Haur_1598 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1598
Symbol
ID	5733485
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	1853285
End bp	1855312
Gene Length	2028 bp
Protein Length	675 aa
Translation table	11
GC content	51%
IMG OID	641278737
Product	hypothetical protein
Protein accession	YP_001544369
Protein GI	159898122
COG category	[R] General function prediction only
COG ID	[COG3889] Predicted solute binding protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000695683
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCAAC GTGTTGTTTG GTTCGCTGTG TTGCTGGTGG CCGTGCTTGG CGTGCCTTTT 
AGCGTTTGGG CTGCAACCCC GCGTCAAACT CCGACCAAAG CACCGCTGGC CGTTCAAGCT 
ACTGTGCGAG TTGTGGAATC GGTTCCCGTG GTGGCTCCGG CGGTGGCAGT AACGGCAACT 
GCGGTTACCT GCGATCCGCT GACCACCCGC TCGTTATATG GCTGGTTCAC CTCGAACACG 
ACTGGCTCGG TTTACAATAG CTCATACACA TGTGCATTTG AGGTAGGGAT TGCCGCATAC 
AGCATGTTTG ATGATCGAAT TGGCAACCAA CAATTGTTTG ACTACACCAT GTATACCGTG 
GCTCCCCGTC AAACCATTAA CTTGAATGTA AAAATTCCTG ATTGCAAAGC CCAACTGGAT 
ATCTTCCGTG GGCCAGTCTT GCACTCGTTG GTTGGTCAGC GCTATGGCGA ACGCTTGCTT 
TCAACGCGCT TCCCCAACAC AACCCTTTGT GCTCCACCAG TTGAAGAAGT GTGTAGCCAA 
GGCCAAATCA GCCGCTTGAG TGGCGTGAGC AACAATCAAT TGGTAACTGG AGTTTTGAAT 
ATTCAAGCTG AAGTTACTGG CGCTTTGCCC CAAAAAGTTG AATTTGCTTT GACTGGTGCC 
CAAACCACCA ACTATACCGA TGTCAACTCG CCCTACTATT TCATGGGCAA CAATGGTAGT 
CAGCCCAATG GTTGGGATTC AAGCACCAAG CCCGAAGGCG ATTATCGCTT GAGCGCAACC 
TATGTTGGTT TGTTTGGTGA ATCATTAGCG ATTCGCTGTG AGCCTGTGGC AGTCAATTTC 
AGCATTCGCC GCAGCACGCC AACCACCGAG CCAACCGCAA CCAGCACACC GTTGCCAACG 
GCAACCAACA CTCCAGTGCC AACCGCGACG AGTACGCCAA CGGCCACTGC AACCAACACG 
CCAGTGCCAA CGGCAACCAA CACTCCAGTG CCAACCGCGA CGAGTACGCC AACGGCCACT 
GCAACCAACA CGCCAGTGCC AACGGCAACC AACACTCCAG TGCCAACCGC GACGAGTACG 
CCAACGGCTA CTGCAACTAG CACACCGTTG CCAACGGCAA CCAGCACACC GTTGCCAACG 
GCAACCAGCA CACCGTTGCC AACCGCGACT AACACGCCAG TGCCAACAGC AACTAGTACT 
CCAGTACCAA CCAGTACTCC TGTGCCTGGT AACCAATGTG TACCACAAGG GTTAGGCACT 
GCTGGCGATT TCAATGTCTT TACCTTTGGC AACATCACCC AAAGCAACAC CGATATTGAA 
GGTCGGGTCG CTGCTGGTGG CAATATCAAC TTCCAAAACT TTGGGGTTGG CGTGCGCTTG 
ACCAATTCAA ATGGTACGCG CGACGACTTA GTTGCCGGCG GTTCGTTGAC CTACACCAAC 
GGTTCGGTTT ACAACGGCAA TGTGGTTTAT GGCACGACTA AATCATTGAA TGGCGTTAGC 
GTCTTGAATG GTACCGTTCG CCAAGGCCAA CCAATCAACT TTGCCAACGA GCAAACTTCA 
TTGCGCAACC GTTCGCAAGC TTGGGGTGGC TTGAGTGCTA ATGGCACGAC GGTCTATGAA 
TATGGTGCAG TCAAGTTGAG CGGAACCAAT ACAACCCTGA ATATCTTCAC GGTTGATGGT 
GCTCAATTGA ATAATGCTAA TGGCTTGAAC ATCAACGTTC CAGCAAGTTC ATCAGTCTTG 
ATTAATATCA CTGGCACGAA CAATCGAATG CAAAATTTCG AAACCTTCTT GACAAATGTT 
GATCAAACCA AGATTGTCTA CAACTTCTAC CAAGCCACTA GCTTTAGCCT CTCAGGGATT 
GGCATCAAAG GTACAATCTT GGCTCCATTT GCTGATGTAA GCTTTAGCAA TGGCCAAATC 
AACGGGACAT TGATTGGTAA CTCATTGATT GGTGGTGGCG AATCACACCA TTATCCATTC 
AATGGTTGTT TGCCAGCAAT TCCAGCTAAC AAGTCAGTTG AACGCTAA

Protein sequence

MKQRVVWFAV LLVAVLGVPF SVWAATPRQT PTKAPLAVQA TVRVVESVPV VAPAVAVTAT 
AVTCDPLTTR SLYGWFTSNT TGSVYNSSYT CAFEVGIAAY SMFDDRIGNQ QLFDYTMYTV 
APRQTINLNV KIPDCKAQLD IFRGPVLHSL VGQRYGERLL STRFPNTTLC APPVEEVCSQ 
GQISRLSGVS NNQLVTGVLN IQAEVTGALP QKVEFALTGA QTTNYTDVNS PYYFMGNNGS 
QPNGWDSSTK PEGDYRLSAT YVGLFGESLA IRCEPVAVNF SIRRSTPTTE PTATSTPLPT 
ATNTPVPTAT STPTATATNT PVPTATNTPV PTATSTPTAT ATNTPVPTAT NTPVPTATST 
PTATATSTPL PTATSTPLPT ATSTPLPTAT NTPVPTATST PVPTSTPVPG NQCVPQGLGT 
AGDFNVFTFG NITQSNTDIE GRVAAGGNIN FQNFGVGVRL TNSNGTRDDL VAGGSLTYTN 
GSVYNGNVVY GTTKSLNGVS VLNGTVRQGQ PINFANEQTS LRNRSQAWGG LSANGTTVYE 
YGAVKLSGTN TTLNIFTVDG AQLNNANGLN INVPASSSVL INITGTNNRM QNFETFLTNV 
DQTKIVYNFY QATSFSLSGI GIKGTILAPF ADVSFSNGQI NGTLIGNSLI GGGESHHYPF 
NGCLPAIPAN KSVER