Gene Haur_1807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1807
Symbol
ID	5733709
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	2100393
End bp	2101403
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	55%
IMG OID	641278950
Product	transport system permease protein
Protein accession	YP_001544578
Protein GI	159898331
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0609] ABC-type Fe3+-siderophore transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0834766
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTACAA CTTTGCTCTC GCGACGCATG CTGATTGGAG TGCTGGCAGC CTTTGGCTTG 
CTGGCAATTG TTATTTTATT GAGCCTTGGG GTTGGCTCGG ATAATGCAAT TGGCTTGGCC 
CAAGTCTTTG CTGTGCTCCA AGGCGCTGGT GATGATCAAG CCCGTTTGAC CGTGCTCGAT 
TTGCGCGTAC CACGCACGAT TATTGGCGTT TTGGTCGGCG TGGCGCTTGG CTCGGCTGGT 
GCATTATTGC AGGCGGCTGC CCGTAATCCT TTGGCTGAAC CAGGTTTGTT GGGAGTAAGC 
GCAGGCTCGG CAACAGCTGT GGTCGTATCG ATTGCGCTTG GAGCCAGCTT GAATAATTTA 
CAAGTTGGCG TTGCCATTTT TGGGGCGTTG ATTGGCTGTA GCGTCGCGCT CGGCGTTGCC 
CGCATGAGTG GCCTCGGTGA TGATCCAATT CGCTTAGTGC TGGCGGGAGC AGCCTTGAGC 
AGCATGCTGG CGGCGGTTTC CTCAGTAATT CTGTTGACCG ATCAACGCAC CGCTGATGAA 
GTGCGCTTTT GGACGATTGG CGCAATTGCT GGCCGTAATT TAAGCAGCAT CACTTCGGCA 
ATTCCCGTAT TATTGCTGGG TTTGGCGGTT GCCTTGCTGC TAGCACGGCC ATTAGCGGCC 
TTGGCACTGG GCGAAAAAGT TGCCAGTGGG CTGGGTCAAC GTCCCAAATT AGTCCGAACA 
GGCGTGATGA TCAGCGTCGC CTTATTGGTT GGTTCGGCCA CGGCGATGGC TGGGCCGATT 
GGCTTTGTTG GGCTAGTGGT GCCGATTGCG GCTCGTGCGA TGGTTGGGCC AGATATTCGG 
CGAGCGTTAA TATTGGCGGT GCTGCTTGGC CCAAGTTTTG TGCTGTTGGC CGATGTGCTT 
TCGCGGATTG TTGCGCGACC AACCGAAACC CCGCTGGGTG TGATTTCAGC ATTAATTGGT 
GCGCCAATTT TGGTGCTGAT TGTGCGCAGC CAACGCTTAC CAGCGCTCTA G

Protein sequence

MATTLLSRRM LIGVLAAFGL LAIVILLSLG VGSDNAIGLA QVFAVLQGAG DDQARLTVLD 
LRVPRTIIGV LVGVALGSAG ALLQAAARNP LAEPGLLGVS AGSATAVVVS IALGASLNNL 
QVGVAIFGAL IGCSVALGVA RMSGLGDDPI RLVLAGAALS SMLAAVSSVI LLTDQRTADE 
VRFWTIGAIA GRNLSSITSA IPVLLLGLAV ALLLARPLAA LALGEKVASG LGQRPKLVRT 
GVMISVALLV GSATAMAGPI GFVGLVVPIA ARAMVGPDIR RALILAVLLG PSFVLLADVL 
SRIVARPTET PLGVISALIG APILVLIVRS QRLPAL