Gene Haur_1299 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1299
Symbol
ID	5733192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	1507179
End bp	1508441
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	52%
IMG OID	641278439
Product	hypothetical protein
Protein accession	YP_001544075
Protein GI	159897828
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGGCGC GGCATAGTAA ATTATTTTGG CTTAGCGGCT TGGTAGCCTT GTTGCTGGCG 
ACGATTGTGC ATCTGGCTTT GACGGCGGCT GGCCCACAGC GCTGGGATGC TTGGGTGCAT 
CTGCTGCTGT ATGGCTGGAT CAGCTGTAGT ATTTTTGCGG TGAATTACCA CACAACTCCG 
GTATTCAGTG GCCGCAATTT CCCCAAACCA GCGTGGTTGG AGTTGCATTG GTTGGTTTGG 
AGTTTGGGTG TCGTGCTGGC CAGCAGTGGC TTGGTTTGGT ATAGCCAACT CAGTTATCGC 
TTAGGCTTGG GTTTGGAGTG GCTGGGCAGT TGGTTGTTTA TGTGGAATAT TATGCAACTG 
TTGCGTAGCC CTAAATTGCG CCCAAGCATG CCATCATCAC CCTTGCAACA ACAGATTGAT 
CGACTCTCGA CCCTCGCCAC GAAAACCTCT GGAGCCAGTT TACCCCTAGC GCTGAGCTTA 
ATTCTTGCTC GTGAATTTGG CTTGATTCAT TCCCGTTGGC TTTTGAGCGC TGAGCATTTA 
TTGACCCTTG GTTGGATGAT GTTGATGATT ATTGGCGTAG CCTGCCATGT CTTGCCGCGT 
TGGTCAGGCC AAGCAACCCG TGATCCGCGT TGGCTAAAAG TGGGCTTGAG CTTGCATCAT 
CTTGGTTTGC TGAGCATTGT GCTTGGCTTG GGCGTTGATC TGCCTGCCCT CTTTGCGCTT 
GGAGCCAGTT TCATTTTAGT GGCCTTAGCG TGTTGTGTTT GGCTGTTGAT TCCGGCCTTG 
GCTACTCCGC CTGTCAAGCA ACCAAGCCAA TTGAGCATTG TGCAGCCGCG CCGCATCGGC 
CCCTTGACCA TGTGGTCGAT TCGCGCGGCA GTCTTTTATT TGGCAGTTGG GATTGGCTTG 
GGCATTAGTT TTGCCTTTGA TCGGGCTTTG GGTGCGCAAC TTCGCCCAAT CCATGTTGAA 
TCGAATTTAG CGGGCTTTGC GACGATCCTG ATTTATGGAA TGGCCTATTT TATGATTCCA 
CGCTTTATGG GGCGACCGTT GGGCTTGGCC AATATTGCTA ATTGGCAGGT GTTTTTGGCG 
ATTAGCGCGG TAGCCATTAT TGATCTTGGG TGGGCTGGAT TAGTGGCTGG CTTGGCTTGG 
GCACGCTGGT TGCTGGTGTT TGGGGCTAGT ATCCATGGCT TGGCGGCACT GCTATTTAGT 
TTGAGCATGC TAGCGACGAT CTATCAGCCT GTGCCATTGC GGCGTTTGGC GCATAAATCT 
TAA

Protein sequence

MMARHSKLFW LSGLVALLLA TIVHLALTAA GPQRWDAWVH LLLYGWISCS IFAVNYHTTP 
VFSGRNFPKP AWLELHWLVW SLGVVLASSG LVWYSQLSYR LGLGLEWLGS WLFMWNIMQL 
LRSPKLRPSM PSSPLQQQID RLSTLATKTS GASLPLALSL ILAREFGLIH SRWLLSAEHL 
LTLGWMMLMI IGVACHVLPR WSGQATRDPR WLKVGLSLHH LGLLSIVLGL GVDLPALFAL 
GASFILVALA CCVWLLIPAL ATPPVKQPSQ LSIVQPRRIG PLTMWSIRAA VFYLAVGIGL 
GISFAFDRAL GAQLRPIHVE SNLAGFATIL IYGMAYFMIP RFMGRPLGLA NIANWQVFLA 
ISAVAIIDLG WAGLVAGLAW ARWLLVFGAS IHGLAALLFS LSMLATIYQP VPLRRLAHKS