Gene Haur_2601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2601
Symbol
ID	5734479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	3339820
End bp	3341934
Gene Length	2115 bp
Protein Length	704 aa
Translation table	11
GC content	47%
IMG OID	641279741
Product	hypothetical protein
Protein accession	YP_001545367
Protein GI	159899120
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000676276
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAAAAT TATTTCGGCG CTTAGGGCGC ATTGGCGCAA TCATTGGTTT ATTGAGCTGC 
GGATTGAGCC TAGCGATTGA TCCAACTCAA GCTAGGCAAC CAAGTGAAAC TTCAAATGCC 
AATTCGTGGA GCAATGAATT TGCTGGGTTT GGTATCAACG CCGACACGCG CGGATTAAGC 
CATCCATTGG TTTGGAATAA TACCCTTTAT GCAGCAGCGA TTGATGGTAG TTCAATGACT 
GATCTTACGG GCGTTGTCTA TTGGGATGGT CGGCAATGGT TAAAGCTCGG AGCCTTGAAT 
GGCTATGTTG AAGCCCTGAC GATTCACCAA GATAAGCTGT ACGCTGGTGG CGTATTGAAA 
CTTAATGGTC AAGATGTTGA TCTCGCTTAT TGGGATGGCA CAACGTGGAC TGGTTTAGCC 
ACCGTTCTCA CGAACAATTA CCTGATGAGC TTGGCGAGTT ACCAAAATGA GCTTTATTTG 
ACCAGTACGC CATTGACAAT CGATGGTCAA GCCTACCAAA ATATTGCCCG CTGGAATGGT 
AGCGAATGGA ATCCAGTCGG TACTGGAGTT GATGGAATTA TTTTGAATGT CGTCAGTGGT 
GCTGATGGTA TCTATGTCAG TGGCTCGCTT GAGCCGATCA ATTCTCAAAA TCAAGGTGGA 
ATTGTGCGTT GGGATGGGAG CCAATGGCAC GATGTTGGTG GTAGAATAAC TGGCTATATC 
ATGGATCTAC AGCTAGTTGA TAATCAGGTC ATTATCGGCG GGGCATTTAC CTCAACCACC 
AACATCCAAA TGCATAATAT TGCTGCTTGG AATGGCACAA CCTGGAATAC CTTTGGCAAT 
GGGATTAACA ATCCAATTGA AAGTGTGTTG CTTCGCGATC AAGGCTTGTT TGCTTTAGGT 
AAGCCAATTG GAATCGATGT GCCGTTATAT GTTTGGAATG GCTCGGATTG GGCGATTGCA 
GCCCAAGCAA GCTATAAAAA TTATGAGTGG CTTGAATTTC CCAAATATTC GTTGGTTGAA 
TTTGACAATG ACATGTATGC CTTGGGTGAT TTATACATCT ATGATCAATA TTATGCGCTG 
AATCGTCTGG TATTTCGCGA TGACCATTGG GAGTCGATGA CCCCCAATGG GTTTGATAGT 
GCTCCACTTA ACTTGAGTAA CGTTGGTGAA ACGATCTATG GGTATGTGCG AACCCACGCA 
ACTTGGGGCA GTGGGCGAGG TGCTCTGATT CGTTCTGATG CTGCGACTGG ATGGCAAACG 
TTAATTGCTG AGCCAGTTGC GAGTGTTATG AGCAATGCCG AACAACTAGA AGTAATCAGT 
GATACGATCT TTTTAATTCA AGCCAATCGG TTGTATCAAA CTACCCAAGT TTCAACAACC 
TGGCTTAGCA TTACGGATCA AACGGTTTTT GGCATGGCCC GTGACCAAGG CAAACTCTAT 
GTAGCAGGTG GTTTTAGCCA ATTTGCTGGG GTCAATACCA ATAATTTGGC AGTTTGGAAT 
AATGGCCAAT GGCAAGCCTT GCATGCTCCA GCCACGTTTA ATCAAGTAAC GGTAGTTGAG 
GCCTTGAATG GCGTAGTCTA TATCAGCGAT GGCGCACAGC TAGCCCGTTG GGATGGGACG 
CAATGGCAAA CGCTGGCTAC TGGTGTGAAT AGCATTCGCC AGCTTGAGGC AAGTGCTGAC 
GGCGTGTATG TTACTGGCAC ATTCAGTAGT ATTGCTGGAG TACCCGCCTA CCAAATTGCC 
TATTGGAATG GCTCACACTG GTCGGCCTTG AGTGGCATGA TTGATGGCCC AATCAATGAT 
CTTGAAATGG GTGTTGATGG CTTGTACGTG GCTGGTTCGT TCAATGGCGT GGCTGGTGGG 
GTGGTTAGCC CAGGTATTTT GCGCTGGAAT GGAATTTGGA ACAGTGTTGG AGGTGGAGTA 
CAACACCGTG ATCAATATGC AAGTGGGTTT ACCGTTACTA GTTTGGTTGC TACCCCAACG 
CGCATGTATT TGAGCGGTGT ATTCGATAGC GTTGGTAATA CCTACGAATC ATCGAGGATT 
GCTGCTTGGA CATATGGCGA GCCAGGCTGG GTTGCGCCAA GCTATGCAGT CTATGCACCG 
TTGACGGTTC GTTAA

Protein sequence

MRKLFRRLGR IGAIIGLLSC GLSLAIDPTQ ARQPSETSNA NSWSNEFAGF GINADTRGLS 
HPLVWNNTLY AAAIDGSSMT DLTGVVYWDG RQWLKLGALN GYVEALTIHQ DKLYAGGVLK 
LNGQDVDLAY WDGTTWTGLA TVLTNNYLMS LASYQNELYL TSTPLTIDGQ AYQNIARWNG 
SEWNPVGTGV DGIILNVVSG ADGIYVSGSL EPINSQNQGG IVRWDGSQWH DVGGRITGYI 
MDLQLVDNQV IIGGAFTSTT NIQMHNIAAW NGTTWNTFGN GINNPIESVL LRDQGLFALG 
KPIGIDVPLY VWNGSDWAIA AQASYKNYEW LEFPKYSLVE FDNDMYALGD LYIYDQYYAL 
NRLVFRDDHW ESMTPNGFDS APLNLSNVGE TIYGYVRTHA TWGSGRGALI RSDAATGWQT 
LIAEPVASVM SNAEQLEVIS DTIFLIQANR LYQTTQVSTT WLSITDQTVF GMARDQGKLY 
VAGGFSQFAG VNTNNLAVWN NGQWQALHAP ATFNQVTVVE ALNGVVYISD GAQLARWDGT 
QWQTLATGVN SIRQLEASAD GVYVTGTFSS IAGVPAYQIA YWNGSHWSAL SGMIDGPIND 
LEMGVDGLYV AGSFNGVAGG VVSPGILRWN GIWNSVGGGV QHRDQYASGF TVTSLVATPT 
RMYLSGVFDS VGNTYESSRI AAWTYGEPGW VAPSYAVYAP LTVR