Gene Haur_1694 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1694
Symbol
ID	5733578
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	1968472
End bp	1969548
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	50%
IMG OID	641278833
Product	permease
Protein accession	YP_001544465
Protein GI	159898218
COG category	[R] General function prediction only
COG ID	[COG0701] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000186998
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGTTG TCAGTATCGA TGTTAAACCC AAAAACCAAC GCAAATGGCT ACTCTTTTTC 
GCGCCAATCA TCGGCATTCT TGGGCTGTGG CTGGCGAGCG GCTGGCTTGT CCCAAGCAAT 
TTAGCCCCCT TAACCAACAA ACTTCAAGGC TTAGTCACCA CCTTTCAAGG GATTTTTATT 
GAGGCGCTGC CCTTTCTTAG TGCAGGGGTG ATTGTTTCGG TATTAATTGG CGAGTTCGTC 
AAGCCGCAGC ATTTGGCCAG TTTTGTGCCC CAAAATGCCT TTGGAGCCTC AATTTTTGGC 
TCGCTTTTGG GCTTGCTGTT TCCGGTCTGC GAGTGTGGGG CGATTCCAAC CAGTCGGCGG 
TTGTTGCGCA AAGGCGCACC AGCCTCAATG GGAATTGCCT TTGCCTTAGC GGCCCCCGTG 
GTCAACCCAA TTGTGCTGAT CTCAACCTCG ATTGCCTTTG GCGATGTGCG TTGGGCTTTG 
GCGCGGGTCG GCTTTACAAT CATCATTGCC TTAACAATTG GCTTGATTAT TGGAGCTGGA 
ATTAAACGCG AAGCAATTTT GACCCCACTT GCCCTAACCC CCGATGTTGA ACATGATCAT 
AGCCATTGCG ACCATGATCA TGGTGCTTGC GACCATACCC ACGAACAACC CAAGGGTCGT 
TTGGCAGGCC TGATTGCCCA CGGCAGCGTT GAATTTTTTG AGATGGCCCA GTATTTGGTG 
ATGGGTTCGT TGTTGGCAGC GACTATGCAA ACCTTCATTC CCCAATCGGC CTTGCTCACT 
TTAAATGATA GCGGCATCGG CTTTTTTGCT CCGTTGTTGG GGATTGTGGT ATTGATGTTG 
GTGGCAGTGC TGCTTTCCGT GTGTTCCACG GTTGATGCTT TTTTGGCCTT ATCGTTCCTT 
GGCTTGTTTC ATCCAGGTGC AGTCATGGCC TTTTTGGTCT TTGGCCCGAT GATTGATATT 
AAAAGTACCT TGATGCTGAC CACGACATTC CGCCGCTCAG CAGTGATGGC AATGGTCGTG 
CTAGCAGCCT TATTTGCAAT TATTGCTGGC TTGATCAGCT ATGTTGTTTT GATCTGA

Protein sequence

MAVVSIDVKP KNQRKWLLFF APIIGILGLW LASGWLVPSN LAPLTNKLQG LVTTFQGIFI 
EALPFLSAGV IVSVLIGEFV KPQHLASFVP QNAFGASIFG SLLGLLFPVC ECGAIPTSRR 
LLRKGAPASM GIAFALAAPV VNPIVLISTS IAFGDVRWAL ARVGFTIIIA LTIGLIIGAG 
IKREAILTPL ALTPDVEHDH SHCDHDHGAC DHTHEQPKGR LAGLIAHGSV EFFEMAQYLV 
MGSLLAATMQ TFIPQSALLT LNDSGIGFFA PLLGIVVLML VAVLLSVCST VDAFLALSFL 
GLFHPGAVMA FLVFGPMIDI KSTLMLTTTF RRSAVMAMVV LAALFAIIAG LISYVVLI