Gene Haur_1902 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1902
Symbol
ID	5733791
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	2294773
End bp	2295852
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	50%
IMG OID	641279046
Product	glycoside hydrolase family protein
Protein accession	YP_001544673
Protein GI	159898426
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACGT TGTCGAACCC AAAAACGGCG ATTAGCGATA CACGGTTTGC CAAGCTAGCC 
CGTGGCATTA ATTTAAGCCA TTGGTTTGCC CAAGATTATA CCAACCAATA TAGTTTGGAG 
CATTTGCGCA CGTACAACAC CGAGGCCGAT ATTGCGCTGC TAGCCAAGCT TGGTTGTAGC 
CATTTGCGCT TTACGCTCAA CCCAGTTGTG CTGCTGAATG AGAGCAATCC AACCGAGTTG 
AATCCTAGCT ATTTGGCCGA AGTTGATCGG GTGATCGATT TGATGTTGGC CCATGATTTG 
GCGGTCATTG TCGATTTACA CCCCGAAGAC GATTTTAAGC AGCGTTTGTT TAGCTCGCCC 
AGCTTGGTCA AAATCTTTGC TAGTTTCTGG CAACGTTTGG CTGCTCACTT GGCTCAGCGT 
GATCCAGAAA TGCTCTTTTT AGAGGTCTTG AACGAACCAG TCGTGACCGA TGCTCAGCAA 
TGGGCTTTTG TCCAAGCCGA ATTATTGGCG GCGATGCGGG CTGGCGCACC CAACCATACC 
TTGATTGCAA CTGGCCATAA ATGGTCGAGC ATTACCGAGT TGTTAGAGCT TGAGCCATTG 
GCTGATCCGA ATATTATCTA CAATTTCCAC TGTTATGATC CGCATACTTT TACGCATCAG 
GCGGCAACCT GGGGCGCACC CTACTGGCCG TATCTCGAAT ATTTGCCCTA TCCATCGAGT 
CCCGAAGCCT TAGCCCCGAT TGTGGCGACG ATTGATGACG ACGTTGCGCG TGATGCTGCA 
ATTAACTATG GCAACGAACG CTGGAACATT GATACGCTAC GTGAGTGGAT TGGCCAAGCG 
GCGGCATGGG CTGAGCAGCA TCAAGTGCGT TTGACCTGCA ACGAATTTGG GGTCTATCGC 
TTCAAAAGCA AGCCTGAAGA TCGGGCGGCG TGGTTGCATG ATCTGCGCAG CGTGCTTGAA 
GAATTTAATA TTGGCTGGAC GATGTGGGAT TATGCAGGTG GATTTAGCGT GGTCAATCAA 
CTGAGTGGTC AGCGTGAAAT TGATGCGCTG ACGGTCGAAG CCCTCGGTTT ACAGCAATAA

Protein sequence

MTTLSNPKTA ISDTRFAKLA RGINLSHWFA QDYTNQYSLE HLRTYNTEAD IALLAKLGCS 
HLRFTLNPVV LLNESNPTEL NPSYLAEVDR VIDLMLAHDL AVIVDLHPED DFKQRLFSSP 
SLVKIFASFW QRLAAHLAQR DPEMLFLEVL NEPVVTDAQQ WAFVQAELLA AMRAGAPNHT 
LIATGHKWSS ITELLELEPL ADPNIIYNFH CYDPHTFTHQ AATWGAPYWP YLEYLPYPSS 
PEALAPIVAT IDDDVARDAA INYGNERWNI DTLREWIGQA AAWAEQHQVR LTCNEFGVYR 
FKSKPEDRAA WLHDLRSVLE EFNIGWTMWD YAGGFSVVNQ LSGQREIDAL TVEALGLQQ