Gene Haur_1476 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1476
Symbol
ID	5733361
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	1724058
End bp	1725548
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	49%
IMG OID	641278614
Product	hypothetical protein
Protein accession	YP_001544248
Protein GI	159898001
COG category	[V] Defense mechanisms
COG ID	[COG2367] Beta-lactamase class A
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.676828
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAG CTTTTTTGCT CTTTTGGGTG ATGATGCTGG CAGTTCTTGC CTGTGGAATA 
GCGATTTACT ATCTCCCAGC AAGCGCGGCA GTCACTCCCT CCAATTCATA TCTTGAACGC 
ACTGCTGCTG TTACTTCCGA GGCTGATGTT CCACCGTTGG TTTCCTCGAT GCCACCAAGC 
GTATGGTTTT TTCCTGAACG CGCCAAAATT GGTAGTGTTG AAATTGGCGG TATGAGCGAG 
GATGAAGCCT TAGCCGCCTT GCAAGCAGCC TATCCCAACC CCACCTTGAC TTTGACCAAC 
CCAGTTTTGC TTGAGCCAAT CAAACTCGAT GGTCAACAAC TTGGCTATCA GCTCGATTTT 
GCCCAAGCCT TACGCGATGC TCACGACCTA GCTGAAAAGC AAATTCCAAT TCGCTTAGCA 
GTCAATGCCT CGTTCGATCA GCAATTGCTC AATCAGACGC TTGGCGAAAT TGAGCAGGCG 
CTAGCTATCT CGCCCACGGT TGGCTATGAT CGGGTGGTCT ATGCCTTTGT GCTGACTCCT 
GGCTTGACGC TTGATCGAAC AGCCTTGGTA GCCGAAATTA CCCAAACCTT GCAACTGAGT 
CAAACTGATC CACTGTTGAT TCCAACGAGT CCAGTCACGG CGAATTTGCA AGCGAGCACC 
GAACAACTAA CGGCAGCCTT GGCCGATCGC GAGGCTGAGT GGGATGGCGT GGTTGGCATC 
TCAGTTTACG ATATGGAAAC CAAGCAATGG TTCGATTATC AAGCCAATAC GGTTTTTTCG 
GGCATGAGCG TGCTGAAAAT TCCAATTTTG CTGCAATCAT TTCTTAGTCG CGAAAGCTTC 
ACCAAAAATC AATATGCCAT GATCGATCTG ATGATTGGTG ATAGCGATAA CGAAGCTTCC 
AACGATCTGC TAGCCATGAT CGGCGATGGC GATAGCTTAG AAGGCGCATA CATCCTTGAT 
CAAACATTAA CTGATATTCT AGGCCTAGAA TATACAACCT TGGCCGCCCC ATTTGAGTCG 
ATCGATTATC TTTCAAATGT CCAGGGCGTA GAAATTCCCC AACGAGGTCA AGAGGGTGCT 
CGGCCCTACA CCGACGCAGA TCCCTATGTC CGTTCATCGC CACGCGAGAT GGCCCAAGTC 
GTTTTGGCGA TTGTCGAGTG TAGCCAAGGC CAAGGGGTTT TGCTAGCAAT CAAAGATAGT 
TTGCTCAGCC CTGAACGCTG CGCTGAAATG TTGGAGATCT TAAGTCGGAA TAAAGATACC 
AACAAAATTG TGGCGGGTGT CGCTGAAGGT AGTTTTGTGG CCCATAAAAG CGGCTGGATC 
GATGATGCTC GTGCCGATGC AGGCTATGTG CGCGATCCCA ACGGTGATGA ATATATTGTG 
GCCATGTGGA TTTGGCAAGA CACCGACTAT ATTGATACAC CAGTTTCTGA TCCACTACTC 
GCCGATCTTT CGCGGATCAT CTATACTGCA CGCCATCCAC AAATTCGCTA G

Protein sequence

MKKAFLLFWV MMLAVLACGI AIYYLPASAA VTPSNSYLER TAAVTSEADV PPLVSSMPPS 
VWFFPERAKI GSVEIGGMSE DEALAALQAA YPNPTLTLTN PVLLEPIKLD GQQLGYQLDF 
AQALRDAHDL AEKQIPIRLA VNASFDQQLL NQTLGEIEQA LAISPTVGYD RVVYAFVLTP 
GLTLDRTALV AEITQTLQLS QTDPLLIPTS PVTANLQAST EQLTAALADR EAEWDGVVGI 
SVYDMETKQW FDYQANTVFS GMSVLKIPIL LQSFLSRESF TKNQYAMIDL MIGDSDNEAS 
NDLLAMIGDG DSLEGAYILD QTLTDILGLE YTTLAAPFES IDYLSNVQGV EIPQRGQEGA 
RPYTDADPYV RSSPREMAQV VLAIVECSQG QGVLLAIKDS LLSPERCAEM LEILSRNKDT 
NKIVAGVAEG SFVAHKSGWI DDARADAGYV RDPNGDEYIV AMWIWQDTDY IDTPVSDPLL 
ADLSRIIYTA RHPQIR