Gene Haur_0595 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_0595
Symbol
ID	5732493
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	687290
End bp	688465
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	48%
IMG OID	641277722
Product	hypothetical protein
Protein accession	YP_001543371
Protein GI	159897124
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAAC ACCAGTCTGA GCAGGATGTG GGCGTGGATA GTCCAGCTAC GCCATCACTG 
CTTCAACGGA ATCGTTGGTT GCGGCGATTG ATGAAATTTG GCTTTGTGGT GGTTGGCCTG 
TTTTTCTTTA TTTTAGCTTT GCGCTTATTA AGTAAAGGTG CAGGTGGCTT GGGGCCATTT 
TTAACCAAAA CCTTGGGGAT TGAAAATGCC CTGAATACCT TGGGCTTTGG GTGGCTCTTT 
GCCTATGGGG TATTGAGTGG CTCGCCCGTG GCCGGAATTG CGCTTTCTTT TTTAGATAGC 
AAAGTAATCG ATCCACTTCA GGCTTTTACG ATGATTACTG GCTCACGGCT GGGTGCATCG 
TTTATTGTCT TGGTGATTGG CTTTATCTAC TTTTTGCGGG GCCGTGAAAA AGCCGCCTCG 
CTTTCAATTG GCGTGTTGGC GCTTAGCGTT ACAGCTACCA CCTATCTGCC AGCATTGGCG 
ATTGGCTATT GGCTCTTGAC TGATAGCGGG CTGGATCAGG TGCGGATCGC CTTGCCATCG 
GCAATTTTCG ATTTCGTCGA GCAGGTGTTT GATCCGATTG TGGCTTGGCT GATTCGCACG 
ATTGATAGTG GGATTGTGAA TATATTTGGG ACAACTCCCG CGACAACTGG GGTTTTACCG 
GCAACGAGTG TGGTAATTTT TGTGGTTGGG GTCGGCACAT TGCTGTTTGC CTTTAACCTT 
TTGGATAAAG CATTGCCGCA GGTTGATGCT GAACATAATG CATTTGGGCG GGTTGGTGGC 
TTGATCTATC GACCGTGGGC GATGTTTTTG CTGGGAGCGT TCGTTACCTC GTTGACCTTA 
TCGGTTTCGG TTTCGCTCTC GATCTTGGTG CCACTTTCGG CTCGCGGCTT TATTCGGCGC 
GAAAATACCT TGCCCTACAT TATGGGAGCC AACATCACCA CCTTTATTGA TACCCTGATT 
GCCTCATTGT TGATCAAAGA TCCATTTGCT TTTACAGTAG TGCTGGCTGA AATTATCAGC 
ATTACAGTAA TTTCATTAAT TATTCTCGTT TTTCTCTATC GCCCATATGA GCGGCTAATT 
TTGCGCTTGC TTGATCGGGT AGTCAACGAT ACGCCGATGT TGGTTACCTT TATGGTGGTG 
ATGGTCGTGA CCCCGATTCT GCTGTTATTT ATCTAG

Protein sequence

MSEHQSEQDV GVDSPATPSL LQRNRWLRRL MKFGFVVVGL FFFILALRLL SKGAGGLGPF 
LTKTLGIENA LNTLGFGWLF AYGVLSGSPV AGIALSFLDS KVIDPLQAFT MITGSRLGAS 
FIVLVIGFIY FLRGREKAAS LSIGVLALSV TATTYLPALA IGYWLLTDSG LDQVRIALPS 
AIFDFVEQVF DPIVAWLIRT IDSGIVNIFG TTPATTGVLP ATSVVIFVVG VGTLLFAFNL 
LDKALPQVDA EHNAFGRVGG LIYRPWAMFL LGAFVTSLTL SVSVSLSILV PLSARGFIRR 
ENTLPYIMGA NITTFIDTLI ASLLIKDPFA FTVVLAEIIS ITVISLIILV FLYRPYERLI 
LRLLDRVVND TPMLVTFMVV MVVTPILLLF I