Gene Haur_4503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4503
Symbol
ID	5736354
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	5764419
End bp	5766572
Gene Length	2154 bp
Protein Length	717 aa
Translation table	11
GC content	55%
IMG OID	641281666
Product	hypothetical protein
Protein accession	YP_001547263
Protein GI	159901016
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGCGTG GTTTGCGTTC GCGCTGGGGC ACTCTTGGAG GGTTGTTGCT GTTGTGGCTG 
ATTATTGGTT GGTGGGCGAA TGCCCAACCA AGCCGCTCGG CCAATCTATT GCAGCATACT 
TCAACCAGCG TTGGCGGCTT GTATGGCCTT GAGCAATCGA ATAGTTTGCC AGGCGCGACT 
GGCCCAACTA CCCGCAGCTA CCGCTGGAGC AATGGCAATT TACACGTGCC ACTCTGGCCG 
GCCAGCAACC ACGCGCGGCT AGTTCAGCTT GAATATGTAG CCCCATTTGG CCCGACCAGC 
TTACAATTTG AGCAAACTCA AGCCCTGAGC CTAGCGTTGC AACCTGAACT CCGCCAACTC 
AGCCTATTTG TGCCCGCCGA TGTGCAACAA TTGCAATTGC GCAATCAGCC AAGCGAACAA 
GATGGACGCA ACTTGGGTTT ATTGCTCAGC CACCTCAGTT GGCAGGAACT TGGTTCAAAC 
GGCTGGGCGG CTTTACCTGA TGCTACGCCG TTTAATTCCA GCAATTTGGC CTTGCTCTGT 
GGCGTAGTGC TATTGCTTAG CCTTGGCTGG GCGCGGCATT GGCTGGCACT CGCTGGCAGC 
GGCTTGAGCC TTGGCTTGGC GGCTTTAGCT TGGTCGGGCA ATTGGCTCAA TCGGGCGGCG 
ATCAACAGCC TGAGCCAATT GTTACTGGTG GCAGCCTTGG CAGTTGGCGC ATACCATATG 
TGGCAGCGTT GGCCACGCCC AGTTAATTGG CGCTGGCTAT TAGTGGCGAT TTGGCTGATC 
ACAACGCTCA GCCTGTGGAC TCCAACGGTA CAATATGATG GCGTTGGCTA TTACGCCTAT 
TTGCGTTCGG CGGGCATCGA TCACGATTTT GATTTTAGCA ACGAGTTTAG CCAAACTCCC 
TTAGAACTCA ACACTGGGGT GAAATTGACC AAAACGGGCT ATGCCGCCAA TCCGTGGAGT 
GTTGGCCCAG CCATGGCGTT CGCACCCTTG TGGTGGCTCG GCCATGGCAT TACCCTGCTC 
GGTGGTTGGC CCAGCGATGG CTATAGTCAA CCGTATCTTG CTTTGACAAC GTGGGGCAGC 
GCCTTAGCTG GATTAATCTT CATCCTAAGT TGCGAGGCAC TGCTGCGCCG CCAATTTAGC 
CCTAAAATCG CCGCCCTAGC CACCATCAGT ATCTATCTTG CTAGCAATTT GCTCTATTAC 
AGTCTCTTTC AAGGAGCCTA CGCCCACAGC CTTTCGGCGG CCTGCGTCAG TTTGATGGCG 
CTGGCCAGTC TACGGTTGCG CGAACAACCA AGCCTTGGGC GTTGGGCGCA ACTAGGCTTG 
AGCATGGGCG CAACGATTGT CAGCTATTGG ATTGGTGCAT TGGTGCTGAT ACTGCCAGCG 
CTGCTGCTTT GGCCGTTGCT GGTTGGCAAA CAACGCCTAG CATGGCCGAA TTTAATCAAA 
GGTCTTGGCA TCGCCGCGCT CGCTGGCTTG CTTGTGGTGT TGCCACAGTT GGCGATGTGG 
CGCTTGCTGT ATGGCGCGTG GCTGACAATT CCGCAAGGTG GCAATTTTGC CACACCGCGC 
AGCAGCCAAC TTTGGCCAAT GCTAGTTGGT TCGCTTTACG GCATGCTCTG GTGGACACCA 
ATCTATGTGC TAGGGTTGGT TGGCTTAGGC TTGAGCATTC GCCAACGGCA AGCTTGGCCG 
TATCTGGCGG CAGTCATTAT TTATTTGATT TATATTTCGC GTTTGCCTGA TTGGCATGGC 
AGTGGAGCCT TTGGTTTACG CCGTTTGACC ACGCTTGCGC CTTGCTTGGC TTGGGGTGTG 
GCAGCCCTGC TGCACCGTTG GCGACACTGG CCGAGCACAG CAATCGGCTT AATCGCAAGT 
TTGGTTGGCT GGAATTTAGC CTTGATGGCA CGCTACATCA CCTATGCGAT TCCACGGGGC 
TATCCAGCAA TTGCCGAATT ACCACTCAGC GCCATTTTGC TCTCCGACCA ACCGCTAGAG 
GCCTCACGGC TTGGTTTATT GATGCGCAAT GGTTGGTTCG GCAGCCAACT GAGCAATCTT 
CAAGGGCGTA GTTTATGGGT GTTTTTGGGG CTTTTGGGTA GTACTGCTGG GGTTTTGGCA 
ATTTGGAGGT GGTTGGGGCG AGCCAACTCG CCAAGCCTAA ATCAAGAGAC TTAG

Protein sequence

MLRGLRSRWG TLGGLLLLWL IIGWWANAQP SRSANLLQHT STSVGGLYGL EQSNSLPGAT 
GPTTRSYRWS NGNLHVPLWP ASNHARLVQL EYVAPFGPTS LQFEQTQALS LALQPELRQL 
SLFVPADVQQ LQLRNQPSEQ DGRNLGLLLS HLSWQELGSN GWAALPDATP FNSSNLALLC 
GVVLLLSLGW ARHWLALAGS GLSLGLAALA WSGNWLNRAA INSLSQLLLV AALAVGAYHM 
WQRWPRPVNW RWLLVAIWLI TTLSLWTPTV QYDGVGYYAY LRSAGIDHDF DFSNEFSQTP 
LELNTGVKLT KTGYAANPWS VGPAMAFAPL WWLGHGITLL GGWPSDGYSQ PYLALTTWGS 
ALAGLIFILS CEALLRRQFS PKIAALATIS IYLASNLLYY SLFQGAYAHS LSAACVSLMA 
LASLRLREQP SLGRWAQLGL SMGATIVSYW IGALVLILPA LLLWPLLVGK QRLAWPNLIK 
GLGIAALAGL LVVLPQLAMW RLLYGAWLTI PQGGNFATPR SSQLWPMLVG SLYGMLWWTP 
IYVLGLVGLG LSIRQRQAWP YLAAVIIYLI YISRLPDWHG SGAFGLRRLT TLAPCLAWGV 
AALLHRWRHW PSTAIGLIAS LVGWNLALMA RYITYAIPRG YPAIAELPLS AILLSDQPLE 
ASRLGLLMRN GWFGSQLSNL QGRSLWVFLG LLGSTAGVLA IWRWLGRANS PSLNQET