Gene Haur_4543 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4543
Symbol
ID	5736939
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	5813662
End bp	5814759
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	46%
IMG OID	641281705
Product	hypothetical protein
Protein accession	YP_001547302
Protein GI	159901055
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAACCC AAATTCGCTC ACGCAAACGT TTATTGGCGA TTGGCGCTGC TGTCTTGGTG 
TTCTTTTTTA TCGTGACAAC GTTGTTAAAT GGTTCGGGTA ATTCAGCAAG CGATAAATTC 
CAAACTGTTT CCGATGCTTT GGATCAAGCT GCAATGCCGG AATCTGCGCC AGCCGCTGAG 
ATGGAGCGTC AAGTAACTAC CGATGGTTTA ATGGATGAAT CCGATGTTGC TGCTGCGCCG 
GCACTTGGCG GGGCTGCTCC TGCCGATGCT GAAAATTCAC AAGAACCAAG TGCCGCCCCC 
AACCAAGCTA CTGATCGTTT GGTAATTAAA AATGCTGATG TTGAAGCCTT AATTGATTAT 
AAGCAAATGC GTTTGGCCAG TACCCAAATT GAAAATATGG TGCTACGCTT GGGTGGCTAC 
ATTGTTTTGA CTGACGATGC TAGCAGCAAT GACGAAGATC AAGCCTATAT TTCGCTGGCC 
TTTCGGGTTC CGGCTGATCA ATTTGAAAAA GCCTTGAATG CCTTTGAAGA AAATAAACTC 
GAAGTTGTGC GCCGTGAAGT TTCTGGCCAA GATGTTACCG AAGAATTTGT CGATAATCAA 
TCACGATTAA CCAACTTAGA AGCCACTGCT GCACGCATTC GTGAATTGCT GGCCAAAGCC 
GAAACCATCG CCGACACGAT TAAAATCAAT GAAACTTTGG CGCAATACGA AAGCCAAATC 
GAAATGATTA AAGGCCGCCA AAAATATCTA AGCGATAGCG CTTCGATGAG CATGATTACC 
TTGTTGATTC GGCCCAAAAC CGCTGATTAC AGCATGTTTA CCAAAATTGA TATTGGTCAA 
AATATTCGCA ATGCCTTAGC TAAAGCCGAA CGTCCAGGCT GGACACCGCT CGCCGCCGCA 
ACTGGTGCTT GGGACGATGT GTTGGAAATT GGCAAAGATG TTGCTGAAAC CTTGGTTGTT 
TGGGCGGTTT GGCTTCCAAT TTGGTTGCCG TTGGTTTTGG CCGCATGGTT TGGCTGGCGC 
AAATGGCGTA AATATAGCCA AAACCAAAGC CAAAATTCCC CAATCACTAA TCAAAATCCC 
CCAGTTAATC AACCCTAA

Protein sequence

MLTQIRSRKR LLAIGAAVLV FFFIVTTLLN GSGNSASDKF QTVSDALDQA AMPESAPAAE 
MERQVTTDGL MDESDVAAAP ALGGAAPADA ENSQEPSAAP NQATDRLVIK NADVEALIDY 
KQMRLASTQI ENMVLRLGGY IVLTDDASSN DEDQAYISLA FRVPADQFEK ALNAFEENKL 
EVVRREVSGQ DVTEEFVDNQ SRLTNLEATA ARIRELLAKA ETIADTIKIN ETLAQYESQI 
EMIKGRQKYL SDSASMSMIT LLIRPKTADY SMFTKIDIGQ NIRNALAKAE RPGWTPLAAA 
TGAWDDVLEI GKDVAETLVV WAVWLPIWLP LVLAAWFGWR KWRKYSQNQS QNSPITNQNP 
PVNQP