Gene Haur_1808 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1808
Symbol
ID	5733710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	2101413
End bp	2102519
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	55%
IMG OID	641278951
Product	transport system permease protein
Protein accession	YP_001544579
Protein GI	159898332
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4779] ABC-type enterobactin transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.537054
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCGAC TTTCGCTGAA CCCAACCACG AGTGCTGCTC ACGAGCTAAA CCTAGCTCAG 
CCATTTACAG GCCAACCAAC TGGCTTGTGG TTGCTGCGCT TTGGCCGTTT GAGCCTGCTG 
TTGGATCGAC GGGCTTGGCT GGCAAGTTTG CTTTTGCTGC TTGCGACGGT AGTTTTGGTT 
GGCCTGAGCC TCGGCAGTGG CACAGTCAAA ATCGCCCCAC TTGATGCCTT GGCAGCTTTG 
TTTAATCAAG GCGAAACCAA AAATATCTTT ATTGTGCGCG ATTTACGGCT GACGCGGGTT 
TTGGCAGGTG GCATGGCTGG CGCTGCTTTG GGTATGGCTG GCTGTTTGTT GCAAACGCTC 
AGTCGCAATC GGCTGGCCAA CCCCGATACG ATTGGGATCG ATAATGCTGC GACGGCCTTT 
GCGGTTGCCT CGGTTGTGGG AGTTAGCACA ACTCTCGCGC CCTCAGGCAT GGCCTTGATT 
GGCGCAATCA CCATGCTTTC CTTAACCTTT GCCTTGAGTG GCGGGGCTGG CACACGTGGC 
TATCGTTTCT TAATCACTGG GCTGGGCTTG GGCGCAATCT GTGGAGCTGC CACCAATTTG 
ATGCTAGCAC GTGCCCCAAT TGATGCTGCC AACGATGCTT TTCCTTGGAC AATTGGCAGC 
TTGAACGATC GTTCGGGAAT TACTGTAAGT TTGCTGGCTT GGGGCGTGGT GATATTACTC 
CCGCTGGCTG CGATCGTGGG TAAACGCCTT AATTTGGTGC GCTTGCCCGA TGCGGTTGCC 
CAAAGTTTGG GGGTGCGGGT CAATCGCTTG CGCTTCTTCA CGATTTTGTT GGCGGGCAGC 
TTGACCGGCC TTGCGGTTGC GGTTGCTGGC CCTGTTGGCA TGATTGGCTT GGCGGCACCT 
GAATTAGGGC GGCGCTTGGC TGGCCCGCGC ACTGTGCCGA TTGTGCCTTC GGCCTTGGCT 
GGCGCATGCT TTACCATGCT GGCTGATTTG CTTGGCCGCA CTTTGTTCAG CCCAACTGAA 
ATTCCGGTGG GCATTGTTAC AGCCTTAGTT GGCGGCCCTT ACTTATTATG GTTCCTGTTG 
CGAACCCCGC GAGGCAAACA ATTATGA

Protein sequence

MDRLSLNPTT SAAHELNLAQ PFTGQPTGLW LLRFGRLSLL LDRRAWLASL LLLLATVVLV 
GLSLGSGTVK IAPLDALAAL FNQGETKNIF IVRDLRLTRV LAGGMAGAAL GMAGCLLQTL 
SRNRLANPDT IGIDNAATAF AVASVVGVST TLAPSGMALI GAITMLSLTF ALSGGAGTRG 
YRFLITGLGL GAICGAATNL MLARAPIDAA NDAFPWTIGS LNDRSGITVS LLAWGVVILL 
PLAAIVGKRL NLVRLPDAVA QSLGVRVNRL RFFTILLAGS LTGLAVAVAG PVGMIGLAAP 
ELGRRLAGPR TVPIVPSALA GACFTMLADL LGRTLFSPTE IPVGIVTALV GGPYLLWFLL 
RTPRGKQL