Gene Haur_0079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_0079
Symbol
ID	5731952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	102430
End bp	104334
Gene Length	1905 bp
Protein Length	634 aa
Translation table	11
GC content	52%
IMG OID	641277201
Product	hypothetical protein
Protein accession	YP_001542859
Protein GI	159896612
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCTTCG CCACACCCGA ACAGGTGCAT CGTTACCCTC GTCGGTTCAA ATGGATTTTT 
GAGGTGCTTT GTACTGTCCT CATTGTAGTT GCTGTGGTGC GTTGGGGACG TGCCGTTTTG 
CAGTATCTCT GGGATAGCCG CAACATCAAT GCAGCCTTTG CTGCCCGCGA CACGTTTTAT 
GAACCCTTGG TCAACTGGTT TAACCAAACC GGAACGACCC GCCCACGCCT GCGCGACTTG 
GCGGATCTTG CGCCTTATTT TGGCTGGTTG GGCTTAACCT TGCTCGTGGT TGTTTTTGTT 
CGTAATTTCT TCCCCACCAT TCGCACGAGC AGCCGTGGTA TTTTAATTGA ATGGGGCAAT 
GGTTGGTTGC CAGTCGGTTG GGAGCAAGTC AGCGGGCTGC GGGTTACCGA AGACCTTTCT 
GGCGAACGCT TTGTGGTGTT GCTGCAAACC AACAATAAGG CCTTGACCGG TTGGCATCGC 
TTTTATAGTG TGCTGTATCG GTTTAGCCTA CGCCGAGGTA TCCTCATTAC CTCGGGCATT 
TCCGATTTTC TACCGTTGGT GCGCATGCTC ACCAGTGAGC TGGAACAGGT GGCTCGCCAA 
ACTAAACAGC CAGCAGTTAA GCTTGATGAA AAGGCTTCCT CGCCGTTGTT TCAATTGTTG 
CTCAGCCCAG CGGGTTTCTT CAGCCGCCGC TCTAAAAGCG ATAAAGATTA TGTTGAGTAT 
GCAACCCAAG CTGGCTTAAC GGCCCAACCT GGTCGGGTCG CTAGCATTAT GGCGACCTAT 
CCCAAACGCA TCAGTAGCTT GCTGGTAATC GGCACGGCAG TGATGGCGGT GCTGGGGCTG 
CTGCGCGTGC TTGAAATGCT GCGCCAATGG ATTGGCCTGA GTTTTGGCGT GGGCGGCATT 
TTCAAAAGTG CCCCTTTACC GCTTGATCAA AGTGCTTGGT GGCTACCCGT CGCCGCTGTA 
CTCCTACTCG TGGTGTTAAT TCCCATTCTG GTGGTTATTC GCAACATTCT GCCCGATATT 
GAATCGCGCC AAGAGGGCTT GATGGTGCGC TATTTCAACC GTTGGCTGCT CGTGCGCTGG 
GAAGAAATTA TCGCAGTCAA AACCGCCAGC CTCTCGGAAA ATAACCATGT GATGCTGATT 
CAAACGACGA ATCAGAGTTT GAAGATGATG CACCACATTT CATCGTTGCT GTTCGATGGC 
TCGAATGCAC GAGGGGTGCT GTTAACGTCA GCATTGAGCG TCTATGATCC ATTGGTGCAG 
CAAATTGTGC TCGAAGTTTC ACGTCGCCAA CGACCTAGTG AGCAAGATGA AGGCATTTTG 
ACCGAAGATG CCCCAGCTTG GTTGTTGCGC TTGATGTTCA AGCCCAGCGA TGCGATCGAT 
CGCATGGTTT CGAATATTTT GCGCCGCGAA GATAGCACCA AAATTAAATT TGATACGATG 
ATGATTCTCG GGCGGCCAAT GGTCTGGCTG ACGGCAATTC CGACATTAAT GCTGCTGGTT 
GAGCGCCATA TTAACGGCGT GCACTATCCA ACCGTCAGCT CAATTATCAA TGTGTTGGTA 
TTTGTTTTCA TCTGTTTGTT GGAATACCCA ATTGCGGCGG CGGTGGCCCA GTTCAGCGAA 
CGCAATCTGG ATGGTGATGC CCATCTGGCC CGTCCGTTTT ACCTCTACCC TACCGCCCAA 
TTGCCACGAA TTGTGGTGAT GTTGGGGGCA TTGTTGCTGC TGGTATTGAA CGTGCCTCTG 
CTGCCAGTGC TGCTCTGGAT TGGCGCAGCA ATTTGGTCAT TCCTCTTGAC CGCTGGTTTG 
TGGGAAGGGC TCTATGGCTG GAGTGGTGGT AAATTATTAG GTATCGGCGC AATTCCGGCG 
ATTATTCAGG TGCTGGCGTT GATGATGTGG GCTTCGATGA GTTAA

Protein sequence

MAFATPEQVH RYPRRFKWIF EVLCTVLIVV AVVRWGRAVL QYLWDSRNIN AAFAARDTFY 
EPLVNWFNQT GTTRPRLRDL ADLAPYFGWL GLTLLVVVFV RNFFPTIRTS SRGILIEWGN 
GWLPVGWEQV SGLRVTEDLS GERFVVLLQT NNKALTGWHR FYSVLYRFSL RRGILITSGI 
SDFLPLVRML TSELEQVARQ TKQPAVKLDE KASSPLFQLL LSPAGFFSRR SKSDKDYVEY 
ATQAGLTAQP GRVASIMATY PKRISSLLVI GTAVMAVLGL LRVLEMLRQW IGLSFGVGGI 
FKSAPLPLDQ SAWWLPVAAV LLLVVLIPIL VVIRNILPDI ESRQEGLMVR YFNRWLLVRW 
EEIIAVKTAS LSENNHVMLI QTTNQSLKMM HHISSLLFDG SNARGVLLTS ALSVYDPLVQ 
QIVLEVSRRQ RPSEQDEGIL TEDAPAWLLR LMFKPSDAID RMVSNILRRE DSTKIKFDTM 
MILGRPMVWL TAIPTLMLLV ERHINGVHYP TVSSIINVLV FVFICLLEYP IAAAVAQFSE 
RNLDGDAHLA RPFYLYPTAQ LPRIVVMLGA LLLLVLNVPL LPVLLWIGAA IWSFLLTAGL 
WEGLYGWSGG KLLGIGAIPA IIQVLALMMW ASMS