Gene Haur_2601 details

Gene Information       Plasmid Coverage information       Fosmid Coverage information       Sequence       

Gene Information

Locus tagHaur_2601 
Symbol 
ID5734479 
TypeCDS 
Is gene splicedNo 
Is pseudo geneNo 
Organism nameHerpetosiphon aurantiacus ATCC 23779 
KingdomBacteria 
Replicon accessionNC_009972 
Strand
Start bp3339820 
End bp3341934 
Gene Length2115 bp 
Protein Length704 aa 
Translation table11 
GC content47% 
IMG OID641279741 
Producthypothetical protein 
Protein accessionYP_001545367 
Protein GI159899120 
COG category 
COG ID 
TIGRFAM ID 


Plasmid Coverage information

Num covering plasmid clones
Plasmid unclonability p-value0.0000676276 
Plasmid hitchhikingNo 
Plasmid clonabilityunclonable 
 

Fosmid Coverage information

Num covering fosmid clonesn/a 
Fosmid unclonability p-valuen/a 
Fosmid Hitchhikern/a 
Fosmid clonabilityn/a 
 

Sequence

Gene sequence
ATGCGAAAAT TATTTCGGCG CTTAGGGCGC ATTGGCGCAA TCATTGGTTT ATTGAGCTGC 
GGATTGAGCC TAGCGATTGA TCCAACTCAA GCTAGGCAAC CAAGTGAAAC TTCAAATGCC
AATTCGTGGA GCAATGAATT TGCTGGGTTT GGTATCAACG CCGACACGCG CGGATTAAGC
CATCCATTGG TTTGGAATAA TACCCTTTAT GCAGCAGCGA TTGATGGTAG TTCAATGACT
GATCTTACGG GCGTTGTCTA TTGGGATGGT CGGCAATGGT TAAAGCTCGG AGCCTTGAAT
GGCTATGTTG AAGCCCTGAC GATTCACCAA GATAAGCTGT ACGCTGGTGG CGTATTGAAA
CTTAATGGTC AAGATGTTGA TCTCGCTTAT TGGGATGGCA CAACGTGGAC TGGTTTAGCC
ACCGTTCTCA CGAACAATTA CCTGATGAGC TTGGCGAGTT ACCAAAATGA GCTTTATTTG
ACCAGTACGC CATTGACAAT CGATGGTCAA GCCTACCAAA ATATTGCCCG CTGGAATGGT
AGCGAATGGA ATCCAGTCGG TACTGGAGTT GATGGAATTA TTTTGAATGT CGTCAGTGGT
GCTGATGGTA TCTATGTCAG TGGCTCGCTT GAGCCGATCA ATTCTCAAAA TCAAGGTGGA
ATTGTGCGTT GGGATGGGAG CCAATGGCAC GATGTTGGTG GTAGAATAAC TGGCTATATC
ATGGATCTAC AGCTAGTTGA TAATCAGGTC ATTATCGGCG GGGCATTTAC CTCAACCACC
AACATCCAAA TGCATAATAT TGCTGCTTGG AATGGCACAA CCTGGAATAC CTTTGGCAAT
GGGATTAACA ATCCAATTGA AAGTGTGTTG CTTCGCGATC AAGGCTTGTT TGCTTTAGGT
AAGCCAATTG GAATCGATGT GCCGTTATAT GTTTGGAATG GCTCGGATTG GGCGATTGCA
GCCCAAGCAA GCTATAAAAA TTATGAGTGG CTTGAATTTC CCAAATATTC GTTGGTTGAA
TTTGACAATG ACATGTATGC CTTGGGTGAT TTATACATCT ATGATCAATA TTATGCGCTG
AATCGTCTGG TATTTCGCGA TGACCATTGG GAGTCGATGA CCCCCAATGG GTTTGATAGT
GCTCCACTTA ACTTGAGTAA CGTTGGTGAA ACGATCTATG GGTATGTGCG AACCCACGCA
ACTTGGGGCA GTGGGCGAGG TGCTCTGATT CGTTCTGATG CTGCGACTGG ATGGCAAACG
TTAATTGCTG AGCCAGTTGC GAGTGTTATG AGCAATGCCG AACAACTAGA AGTAATCAGT
GATACGATCT TTTTAATTCA AGCCAATCGG TTGTATCAAA CTACCCAAGT TTCAACAACC
TGGCTTAGCA TTACGGATCA AACGGTTTTT GGCATGGCCC GTGACCAAGG CAAACTCTAT
GTAGCAGGTG GTTTTAGCCA ATTTGCTGGG GTCAATACCA ATAATTTGGC AGTTTGGAAT
AATGGCCAAT GGCAAGCCTT GCATGCTCCA GCCACGTTTA ATCAAGTAAC GGTAGTTGAG
GCCTTGAATG GCGTAGTCTA TATCAGCGAT GGCGCACAGC TAGCCCGTTG GGATGGGACG
CAATGGCAAA CGCTGGCTAC TGGTGTGAAT AGCATTCGCC AGCTTGAGGC AAGTGCTGAC
GGCGTGTATG TTACTGGCAC ATTCAGTAGT ATTGCTGGAG TACCCGCCTA CCAAATTGCC
TATTGGAATG GCTCACACTG GTCGGCCTTG AGTGGCATGA TTGATGGCCC AATCAATGAT
CTTGAAATGG GTGTTGATGG CTTGTACGTG GCTGGTTCGT TCAATGGCGT GGCTGGTGGG
GTGGTTAGCC CAGGTATTTT GCGCTGGAAT GGAATTTGGA ACAGTGTTGG AGGTGGAGTA
CAACACCGTG ATCAATATGC AAGTGGGTTT ACCGTTACTA GTTTGGTTGC TACCCCAACG
CGCATGTATT TGAGCGGTGT ATTCGATAGC GTTGGTAATA CCTACGAATC ATCGAGGATT
GCTGCTTGGA CATATGGCGA GCCAGGCTGG GTTGCGCCAA GCTATGCAGT CTATGCACCG
TTGACGGTTC GTTAA
 
Protein sequence
MRKLFRRLGR IGAIIGLLSC GLSLAIDPTQ ARQPSETSNA NSWSNEFAGF GINADTRGLS 
HPLVWNNTLY AAAIDGSSMT DLTGVVYWDG RQWLKLGALN GYVEALTIHQ DKLYAGGVLK
LNGQDVDLAY WDGTTWTGLA TVLTNNYLMS LASYQNELYL TSTPLTIDGQ AYQNIARWNG
SEWNPVGTGV DGIILNVVSG ADGIYVSGSL EPINSQNQGG IVRWDGSQWH DVGGRITGYI
MDLQLVDNQV IIGGAFTSTT NIQMHNIAAW NGTTWNTFGN GINNPIESVL LRDQGLFALG
KPIGIDVPLY VWNGSDWAIA AQASYKNYEW LEFPKYSLVE FDNDMYALGD LYIYDQYYAL
NRLVFRDDHW ESMTPNGFDS APLNLSNVGE TIYGYVRTHA TWGSGRGALI RSDAATGWQT
LIAEPVASVM SNAEQLEVIS DTIFLIQANR LYQTTQVSTT WLSITDQTVF GMARDQGKLY
VAGGFSQFAG VNTNNLAVWN NGQWQALHAP ATFNQVTVVE ALNGVVYISD GAQLARWDGT
QWQTLATGVN SIRQLEASAD GVYVTGTFSS IAGVPAYQIA YWNGSHWSAL SGMIDGPIND
LEMGVDGLYV AGSFNGVAGG VVSPGILRWN GIWNSVGGGV QHRDQYASGF TVTSLVATPT
RMYLSGVFDS VGNTYESSRI AAWTYGEPGW VAPSYAVYAP LTVR