Gene Haur_3004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3004
Symbol
ID	5734891
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	3792895
End bp	3794646
Gene Length	1752 bp
Protein Length	583 aa
Translation table	11
GC content	52%
IMG OID	641280148
Product	inner-membrane translocator
Protein accession	YP_001545770
Protein GI	159899523
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4177] ABC-type branched-chain amino acid transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.940026
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAAATA CAAAGCGCTA TTTGATAACT GGTGGAATTG GCTTTGCAGT TGGGACATTC 
TTTTTATGGA ATTACCCGAA TCTTGCGCTT GGCTCGGCAA TAATTGGTGG TCTGGTCATT 
GCCGCGCTCT GTTTGCTCTA TAGTGCGCCC TTACCCGATA TGGTTAAAGG TGGCTTAATT 
GCTGGTTTGT TCGGCGCAGT CATGACAATT GTCTATGGCC CCGATAAGCC AGGGGTGGCG 
ATTATTGCGG GCATGCTCAG TGGTTTGGGC GCTGGTTTGC TGGCATTTCA ACGCAAACCA 
CAAGCAACGC CCCAAGCTGG GGCTGCTTTG GGCGCTGGGG CTGGCGCAAT TGCTGGCGCT 
TGGACGGCCC TCGCCCTCTT TTTAACTGCC TTTGTGATCG CTCCCGCCGC TGGGGTTGAT 
GCTAGCGAGT TTGCCGAGCA TTTATCCGAA ACCGTGATTT TGGCTGATGC GATGGGCTTA 
GCCAGCGATA TTCTGATTTT GCTGTTTGTG TTGGTGTTTT GTACCATCAC TGGCGCATTA 
TTGGGGGCGG CAGCGGGTGC AGCACGGGCT TTGCCGTTGC GGCCTAATAT CCCACTGTTA 
GCGGTGATTG CCCTGCCAGT GATCTTGATT CCCTTGATTG ATCGTGCTGG CAACTTGCTC 
TTGCTTGATG CCTTGATTCC GATTTATATC TTTATTCTCC TGGCCTTAGG CTTGAACATT 
GTGGTGGGTT ATGCGGGCTT GCTTGATTTA GGTTATGCAG CCTTCTTTGC AATTGGTGCT 
TACACCACCG CCATGCTCTC ATCGCCGCAC CTTGGCATCA ACATTAGTTT TTGGTTGGTA 
ATTTGGGTGG CGGCGGCGGT CGCGGCAATT GCTGGTTTAG CCTTGGGTGC GCCCACGCTA 
CCCTTACGAG GCGACTATTT GGCGATTGTG ACCCTTGGTT TCGGCGAAAT TGTGCCGATT 
CTCTTCCGCA ACCTTGGTGG TGGCCCACCC ACAGGAACCT TGACCTTGCG CTTCTTCGGC 
CTGCCAATTG GGATTGAACA GATGGACTTG ACTGGTGGTA ATAAGGGGAT TAACCCAATC 
TCGCCGCCAA ATTTGCCGTT GATTGGCAAT TTCGAGCCAT CGAACAAAAT TCCTTGGTAT 
TACCTGTTGA TTATCATCAT GGGCTTGGCG ATTTTCTTCA TCAACCGCCT GCGTGATTCA 
CGCCAAGGCC GCGCTTGGAT GGCCATGCGC GAGGATGAAT TGGCCGCTGA TGCCATGGGT 
ATCAACGTAG TACGCACCAA GTTGTTAGCC TTCTCGATGG GGGCAATGTT CTCAGGCTTT 
GGTGGTGCGT TCTATGGCGC ATTCATCGGA GCGATTTTCC CAAGCTCATT CGACTTTAGC 
GTTTCAATCA TCTTGCTCTG TATGGTGATT CTTGGTGGTT TGGGCAATAT GGCCGGGGTG 
ATTGTCGGTG GCTTGCTAAT TCAGGGCGCT GATAAGATGT TTATCCCCAA AGGTGCCGAA 
TTGTTCCGCG ATATTGCTGA CCAGAGAGCC CTCACCACCG GTGGTAGTAC GGTCGGGGTT 
TCCGCTCTAC AAGATTTGAC CCAACAACGT TTATTGTTGT TTGGCATCGT GTTGGTGGTG 
ATGATGCTGA TTCGACCAGA AGGCCTGTTG CCCAACGAGC GCCGTAAAGC CGAATTACAT 
TCCGATGATG ATCCGATCAA TATCAATAGC GTGGCAGCCG AGGCGGATGC TGATCCGTCG 
TTGGCGGCGT AG

Protein sequence

MPNTKRYLIT GGIGFAVGTF FLWNYPNLAL GSAIIGGLVI AALCLLYSAP LPDMVKGGLI 
AGLFGAVMTI VYGPDKPGVA IIAGMLSGLG AGLLAFQRKP QATPQAGAAL GAGAGAIAGA 
WTALALFLTA FVIAPAAGVD ASEFAEHLSE TVILADAMGL ASDILILLFV LVFCTITGAL 
LGAAAGAARA LPLRPNIPLL AVIALPVILI PLIDRAGNLL LLDALIPIYI FILLALGLNI 
VVGYAGLLDL GYAAFFAIGA YTTAMLSSPH LGINISFWLV IWVAAAVAAI AGLALGAPTL 
PLRGDYLAIV TLGFGEIVPI LFRNLGGGPP TGTLTLRFFG LPIGIEQMDL TGGNKGINPI 
SPPNLPLIGN FEPSNKIPWY YLLIIIMGLA IFFINRLRDS RQGRAWMAMR EDELAADAMG 
INVVRTKLLA FSMGAMFSGF GGAFYGAFIG AIFPSSFDFS VSIILLCMVI LGGLGNMAGV 
IVGGLLIQGA DKMFIPKGAE LFRDIADQRA LTTGGSTVGV SALQDLTQQR LLLFGIVLVV 
MMLIRPEGLL PNERRKAELH SDDDPININS VAAEADADPS LAA