Gene Haur_3040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3040
Symbol
ID	5734912
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	3839583
End bp	3840689
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	49%
IMG OID	641280184
Product	serine/threonine protein kinase
Protein accession	YP_001545806
Protein GI	159899559
COG category	[K] Transcription [L] Replication, recombination and repair [R] General function prediction only [T] Signal transduction mechanisms
COG ID	[COG0515] Serine/threonine protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000020347
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAACT TAAGTAATCT TCAACTTGGG GAGTATCATC TAGCTGAGCA GATCGGCCAA 
GGCGGTATGG CGGTTGTCTA TAAGGCTGAA CATCCACAGT TTGGCACAAC CGCATTTAAA 
GTCTTGCCTT CAATGCTGAT CCATGTCGGC GAATTGTTAA CCCGTTTTCT CAACGAGGCT 
GACGCTGTGC GGATTTTACA TCACCCGCAT ATTGTCCAAT CGTATGAGAC CGGAGCAGTG 
CCCCATCCCC AACTAGACGA GGAGGTCTAT TTTATTGCGC TCGAATACAT CGAGAATGGT 
TCGTTATTGG AGCGCATGAT CGCTAGCTCG CTCGCCGTCG AAGATGTGAT CAAAATGGGC 
ATCGATATTG GCTATGCCTT GGAATATGCT CATAGCAAGG GGATTATTCA CCGCGATATC 
AAGCCCAGCA ATATCTTATT TCGCAACAAT GGTCAAGCCG TTTTAGCCGA TTTTGGCATC 
GCCAGCACGG CCCAATATAT TCGGCTCACC AAAACCGGCA ATGTCACTGG CACAATCGCC 
TACATGGCCC CAGAAATTAT GCAAGAAGTG CCAGCCTCGC CACGCTCGGA CCTCTACTCG 
CTGGCCTTGG TGCTCTATGA AACCTTGACC AATTCACGGC CTTTTGGCAC CGATACAGCC 
TCACCACAGT TGGTGCAAAA AATCTTGCAA GAGCGAATTC CGCCACTGCA AGATGTTATA 
CCGGATATTT CACCAACAAT CGCCCACGTC ATCGAACAAG CCTTGGCCAA ACAGCCAAGC 
CAGCGCCAAA CATCGGTTGG TGAATTTGTC AGCCAATTGC AACATGCGCT GCAACGCCGT 
ACCCCCAGCC AATTTACCAT CCCATTGCCT GAGCCATCCG AGGATCTATT GGTCGATCAG 
TTTACCAAGC CCCAACAACG TAAGCCCAAG GCTAAACCGA TCGAGGTCAA TCGACCAAAT 
GCGGCTGCTT CATCAACGCT TGGCATTCAA GCCAGCAATG ATCTCGCCAG CTCGCCACGG 
GCAAAATTTA CGACAACCCT CCAGTTTGTG TTAATCGCAG TTGTGACCTT CTTTTTAGTC 
CTAGGTATTT TTTTCATTTT TCAATAA

Protein sequence

MQNLSNLQLG EYHLAEQIGQ GGMAVVYKAE HPQFGTTAFK VLPSMLIHVG ELLTRFLNEA 
DAVRILHHPH IVQSYETGAV PHPQLDEEVY FIALEYIENG SLLERMIASS LAVEDVIKMG 
IDIGYALEYA HSKGIIHRDI KPSNILFRNN GQAVLADFGI ASTAQYIRLT KTGNVTGTIA 
YMAPEIMQEV PASPRSDLYS LALVLYETLT NSRPFGTDTA SPQLVQKILQ ERIPPLQDVI 
PDISPTIAHV IEQALAKQPS QRQTSVGEFV SQLQHALQRR TPSQFTIPLP EPSEDLLVDQ 
FTKPQQRKPK AKPIEVNRPN AAASSTLGIQ ASNDLASSPR AKFTTTLQFV LIAVVTFFLV 
LGIFFIFQ