Gene Haur_3006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3006
Symbol
ID	5734893
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	3795932
End bp	3797155
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	50%
IMG OID	641280150
Product	extracellular ligand-binding receptor
Protein accession	YP_001545772
Protein GI	159899525
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGTT TCCTTTCATT CTCGCTCGTC TTGACCATGA TCATGGTGAT TTTGGCCGCA 
TGTGGCACCC AAACTGGTGG AACAACCAAA ACTACCGTCA CGATTGTTAG TAGCTTACCC 
CGCACCGGTT CCTCAAAAGG ACAAACAGAT ACCATTGTAA ACGCCATTAA GATGCGTTTA 
GAAGAAGCCA AATACACCGC GTGCGATGGG AATGTTGAGA TCAAGTATGA AGATCTTGAC 
GATGCAACCG CAGCTAAAGG CGCTTGGGAT GAAGCGAAAG AAGCCGAAAA CGCTAATGCT 
GCTGCTTCAA ACAAAGATGT GATGGTCTAT ATCGGTACCT TCAACTCAGG TGCTGCCAAG 
ATCTCGATTC CGATCTTGAA CAATGCTGGG ATTGTGATGA TCAGCCCTGC CAACACCTAC 
CCTGGCTTGA CCAAGGATGG CAAAGGTGCT GAAGGCGAAC CAGCAGTTTA CTATCCCAAA 
GGTACGCGCA ACTACACCCG CGTGGTGCCA GCCGACGACT TGCAAGGCGC TGCCGCAGGC 
AACTGGGCCA AAGAATTGGG CGTAACCAAT GTCTACATCT TGGATGATAC CGAGTTGTAT 
GGCAAAGGGA TTGCTGACGT ATTTGCTGCT ACCGCTGAAA AGAATGGCAT CAAGATTGCA 
GGTCGCGATA GCATCGATGC CAAAGCTAGC GATTACAAGG CGTTGATGTC GAAAATCGCC 
GCTACCAACC CCGATATGAT CTACTTCGGT GGCATCACCC AAAGCAACGC AGGCCAATTG 
GTCAAAGACA TGCGGGCTGC TGGGATGACC GCTGATAAAG TTAAGTTCAT GGGTCCAGAC 
GGGATCTTCG AACAAGCCTT TATCGACGCT GCTGGTGCTG ATAACGCTGA AGGCGTTTAT 
GCAACCTTCG GTGGCGTTCC ACCAGCCAAG CTTGAAGGCA AAGGTGCCGA ATGGTACAAC 
GCCTACAAGG CCAAATTCAA CGCTGAACCA GAAGCCTACG CTGTCTACGG CTACGAATCA 
ACCAACGTGG CGTTGGCTGC GATCAACCAA TCATGTGCTA GCATCAACCG CGAAACCATC 
TTGAAGAACG TTTTCGCAAC CAAAGATTTT GATGGCGTGT TGGGCAAATG GGGCTTCGAT 
GCAAGTGGCG ACACGACATT GACCCAAATG AGCGGCCAAC AAATCAAGGG TGGCGCGTTC 
GAATTCGTTC AAGTCCTCAA GTAA

Protein sequence

MKRFLSFSLV LTMIMVILAA CGTQTGGTTK TTVTIVSSLP RTGSSKGQTD TIVNAIKMRL 
EEAKYTACDG NVEIKYEDLD DATAAKGAWD EAKEAENANA AASNKDVMVY IGTFNSGAAK 
ISIPILNNAG IVMISPANTY PGLTKDGKGA EGEPAVYYPK GTRNYTRVVP ADDLQGAAAG 
NWAKELGVTN VYILDDTELY GKGIADVFAA TAEKNGIKIA GRDSIDAKAS DYKALMSKIA 
ATNPDMIYFG GITQSNAGQL VKDMRAAGMT ADKVKFMGPD GIFEQAFIDA AGADNAEGVY 
ATFGGVPPAK LEGKGAEWYN AYKAKFNAEP EAYAVYGYES TNVALAAINQ SCASINRETI 
LKNVFATKDF DGVLGKWGFD ASGDTTLTQM SGQQIKGGAF EFVQVLK