Gene Haur_2159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2159
Symbol
ID	5734032
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	2722500
End bp	2723801
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	49%
IMG OID	641279300
Product	hypothetical protein
Protein accession	YP_001544927
Protein GI	159898680
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCATAC CGACAACACA ACAATGGACA GCCGACGTTG TACATACGCT GTTAAACTAC 
CCGCAACGGC TGCTGGAGCA TCCTACTTGG GCGCTGGTTA TCGCCGAATT TGGCGGCATT 
CGGCAACTGC GTCAACACCT CTTAACTTAT CCATTTAAAG CCAAAGAATT GCGTTTGCTC 
AAGGTGCTGC TCGACTATCC CGATGCCGCA GTTGAATATT ATTGCGACCT GTTGGCAATG 
CATCCGGCTA CCTTTCATCG CCAACACAAG GCACTCTGCC AACGCTTGAG TGGTTTATTG 
CCTGTGCCAC GTGCCGATGA TCAACCTGCC CCCGAATTGG CGCAATTGCC CTATATCAAG 
CCTAAAACCA GCTTTATTGG CCGAGCGCTC GATCTTGAGC GAATTCAATT GCTGTTTGAT 
CAAGGTTGTC ATTGGATTAG CTTGGTTGGC GCGGCTGGAA CGGGGAAAAC GCGCTTGGCC 
TTGGAAATGA GCCAACGGGT TAGCTCAATG TTTGGCGATG GGATTTGCCT ATTGCAGCTG 
AATGCTGGCG TTGAGCTAGC AACGCTGGCT GAATACTGTT TAAGCCAACT TGGGCTTGAG 
CCGTTATGCG ATGATCCACG CCAGCGGTTT CAAGCCTATT TTGGTTCACG CCAAATCTTG 
CTGATTCTTG ATAACCTGGA TCAGCCAGAG CTTGCAACTT GGTTTGAGGA CACCTTACAA 
GCTGCGCCGT TTGTGCGGGT TATATCCACT GGTTGCCAGC GCTTAAATGT GCCGAATGAA 
TGCTTACATC ATGTTGAGCC GCTTAACTAT CCACAGCATG ATGCTCAACC TACCTCACTT 
GCTGAGAATC CTGCCCTGCA ACTCTTGCTT GAACGATTAA CTCCATTTCA GCCAATTGAT 
CTGACCAAGC TAGAACAGCG CAGAATGCTC ATCCAGATTT GTCAGCTGCT TGACGGAAAG 
CCGCTGGCCT TAGAGTTAGC TGCTGGTTTA GCTGTAACCC ATGATTTAGC GACGCTTGTG 
GCCCAACTTC AACTGATCGA TGCACTTAAT GCTGCGTCTG AAGCTCTAGG ATTGCTCATT 
GCACTGAGCC ATGCTGCGCT CCAACCAACA ACGCAACAGC TTTTGGCGCA ATTGTTGAAG 
CTGGCGCAGC ATGCATGGCG AACTGAACTT TATGCTTCAA ATGAAGTTAA GCCTAGTGAG 
ATTGCTAGCG GTTTACAGGA AGCCCAAATT AAACATTTCT TGATTGATTT AGGGCATTGG 
TATGCAATTC CAGGGAGTAT CCAACGCTTT ATCGCTGGTT AG

Protein sequence

MTIPTTQQWT ADVVHTLLNY PQRLLEHPTW ALVIAEFGGI RQLRQHLLTY PFKAKELRLL 
KVLLDYPDAA VEYYCDLLAM HPATFHRQHK ALCQRLSGLL PVPRADDQPA PELAQLPYIK 
PKTSFIGRAL DLERIQLLFD QGCHWISLVG AAGTGKTRLA LEMSQRVSSM FGDGICLLQL 
NAGVELATLA EYCLSQLGLE PLCDDPRQRF QAYFGSRQIL LILDNLDQPE LATWFEDTLQ 
AAPFVRVIST GCQRLNVPNE CLHHVEPLNY PQHDAQPTSL AENPALQLLL ERLTPFQPID 
LTKLEQRRML IQICQLLDGK PLALELAAGL AVTHDLATLV AQLQLIDALN AASEALGLLI 
ALSHAALQPT TQQLLAQLLK LAQHAWRTEL YASNEVKPSE IASGLQEAQI KHFLIDLGHW 
YAIPGSIQRF IAG