Gene Haur_4871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4871
Symbol
ID	5736948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	6204881
End bp	6206362
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	49%
IMG OID	641282037
Product	hypothetical protein
Protein accession	YP_001547629
Protein GI	159901382
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCGCC AACAACAGCT TGCGCTGTAT CTTTTGCCAG TGGCTTTTGG GCTGGCCCTG 
ATTGCCGATT TACTAGGCTT GTTTCACCAA TTATGGGGCA TTAATTTTGT ACTTTGGACG 
TTGCTCTCAA GCGGCGCAAT CGTTGGCTTG GCGTTTAAGC AAGCCCAAGC CTTGCCCAAA 
GAAACCTGGC TCTGGCTCGT AGTTGCCAAT ATCGCAAGCT TGGGCTTTGT GCTGCGCGAT 
AATGGCGCGA TCTTGTTTTG GCTGGGCTTG TGTTGGGTCT TGGCTTGGAT GCTCATTTTC 
AGCCAACCTT ACCGCGCTCA TTGGCAATTG GCCTCAATTC GCGGCTGGAT TGTATCGGGC 
GTGGTGGCTG GATTTGGGGC TGCGTTCGGT AGCTTTGCCG CATCGATTCA TCTGCCACTG 
CGGGTTGGTA ATTTCACTAG CGCCAAATTA CGGCCAATTT TGATTGGGCT AGGTTTAGCC 
TTGCCATTAT TGTGTGTGTT TGGCGGCTTG TTTGCCTCAG CCGATGCAGT ATTTGAAAAT 
ATTTTCGCCG ATTTGTTTAA CTGGAATTTG GATTGGCTGT TTGAGCATGC ATTTGTGGTG 
TTGTTTAGCA CTTGGGCGAT TTTGGGTTGT GGCTGGATTT TATTTGCTGC ACCAAAACCA 
GATATTGCGT TGAGCCAACG TCCAAGCTTA TTCAACATTG GCAAGATCGA AGTTGGCATC 
ATTTTGGGCT TGCTGAATGC GCTTTTTGGT TTGTTTGTAT TGATTCAAAT TCGCTATTTA 
TTTGGTGGCG AACAGCAAAT TGCCGAAGGT ATTAGCTATG CCGATTATGC CCGCCGTGGC 
TTTTTCGAGT TGGTAACCGT GGCCTTATTG GTCTTGCCAA CGTTGCTAGT TGGTAGCTGG 
CTGAGTGAAC AACGAACTGA AGCCCAACCC TTGTTTCGGA TTTTGGCCTT GGTATTATTG 
GTACAAGTTG GGGTGGTGTT GGCTTCGGCT GTTTCGCGTA TGCTGCTCTA CATCGATGCT 
TATGGTTTGA CTGAATCGCG GATTCAAGCA ACAGCCTTGA TGATTTGGAT TGTGCTGGTG 
GCCTTGTGGT TTGTGGCAAC CGTGCTGCGC CAACGGGGTC AATATTTTGC CAATGGAGCC 
TTGGTTGCGG CCATGTTGGT GCTGATTGGC TTGGTTTTGT TGAATCCTAG CAATTTGATT 
GTGCGCTACA ACGCCAGCCA TCGCGGCGTG GCCAGCTTTG ATGGCTACTA CATTGGCAGT 
TTGGCCGATG ATGCTGATGC CGTGCCAGCG ATTATCGAGG TGCTGCCGAG CTTGCCTGCG 
GAACAAAATT GCCAAATTGC TACGCTCTTA TTAGATAATT GGCAAGAAAA TAACGACGAT 
TGGCGCAGTG CCAACCTTAG TCGCAGCAAT GCTCGTCAGG CTGTGCTGCA AAACGAACGA 
ATGCTGACCG ACATGAGTTG TCCAATTGAT CGCTCAATGT GA

Protein sequence

MTRQQQLALY LLPVAFGLAL IADLLGLFHQ LWGINFVLWT LLSSGAIVGL AFKQAQALPK 
ETWLWLVVAN IASLGFVLRD NGAILFWLGL CWVLAWMLIF SQPYRAHWQL ASIRGWIVSG 
VVAGFGAAFG SFAASIHLPL RVGNFTSAKL RPILIGLGLA LPLLCVFGGL FASADAVFEN 
IFADLFNWNL DWLFEHAFVV LFSTWAILGC GWILFAAPKP DIALSQRPSL FNIGKIEVGI 
ILGLLNALFG LFVLIQIRYL FGGEQQIAEG ISYADYARRG FFELVTVALL VLPTLLVGSW 
LSEQRTEAQP LFRILALVLL VQVGVVLASA VSRMLLYIDA YGLTESRIQA TALMIWIVLV 
ALWFVATVLR QRGQYFANGA LVAAMLVLIG LVLLNPSNLI VRYNASHRGV ASFDGYYIGS 
LADDADAVPA IIEVLPSLPA EQNCQIATLL LDNWQENNDD WRSANLSRSN ARQAVLQNER 
MLTDMSCPID RSM