Gene Haur_3133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3133
Symbol
ID	5735005
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	3960337
End bp	3961608
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	49%
IMG OID	641280276
Product	ABC transporter related
Protein accession	YP_001545898
Protein GI	159899651
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1134] ABC-type polysaccharide/polyol phosphate transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTATTT TCGAGAACGT TTCCAAGCAT TTTACGATCA AACGTGATCG ACGTAATAGT 
ATTCAGGAAC GGATCGCCGG TTTATTCAAG CCGCAAGTGC TGCCTGACGA GGATTTTTGG 
GCGTTACGCG ATGTCAGTTT TACGATCAAT CGTGGCGAAA CGGTTGGCCT AATTGGCCAT 
AATGGTTCAG GCAAATCGAC CACACTCAAG CTAATTACCC GTATTTTGCA GCCCAACAGC 
GGCAAAGTAA TTGTCGATGG CCGGGTTTCG GCCTTGCTTG AGCTTGGTTC AGGCTTCCAC 
CCCGACCTAA CAGGCCGCGA AAATATCTTC TTGAATGGCT CGCTGCTCGG CTTCAATCGG 
GCCGAAATGG CCGAAAAAGT GCCAGCGATC ATTCGCTTCT CCGAGATGCA AGAATTTATC 
GACATGCCCG TCAAGCACTA TTCATCGGGG ATGTATATGC GCTTGGGCTT TGCCGTGGCG 
ATCAACGTCG ATCCCGATAT TTTGATCACC GACGAAGTGC TCGCGGTTGG CGATGAGTTG 
TTTCAGCGCA AATGCTTGGA TCGGATTTAC CAACTCAAAC GCCGTGGCAA AACGATTTTG 
TTCGTCTCGC ATGCCTTGGG CCAAGTGCGC GACTTATGCG ATCGGGCCTT GTGGTTTCAT 
CATGGCAATT TAATGACCGA TAGCACACCC ACCGAAACAA TCGACAATTA TTTAGCCGAA 
ACCAACCAAC GTGATGCTGA GCGGATCGAG GCCGAAAAAG CCGCCGAAAA CCCTGAACCA 
GAAGCACCAA GTACTGAAAT CGAAACCAAG ACCGAAGAAG AAATCGAATT TGATGCTCGG 
CGCTGGGGCA GTCGTGAGGC TGAGATCTAT AATGTAGAAT TGTTGAATGC TGCTGGCGAA 
GTGATTCAAA CCGCTACCAC CGGCCAAGCT CTGACCATTC GCATGCACTA TCAAGCCCAC 
CAACCAATTG AAAAACCGGT CTTTGGCGTG GCAATCCATC ATCGCACAGG CTTTCACATC 
AACGGGCCAA ATTCGCGCTT TGCTGGGCTT GAAATTCCCC AAATCGCCGA ACAAGGCTAT 
GTTGATTATC AGATCGAAAA TCTACCGTTG CTTGAAGGCA ACTATGAACT TTCGGTGGCG 
TTGTATGACC ATACCTTGAC CCATCCGTAT GATCATCACG ATCGCAAACA CAATTTACGG 
GTGTATGCGG CCTCAATTGG TGAACAATTT GGCACAATTT ATATTCCTTC GCAATGGTCT 
TGGCATAAAT AA

Protein sequence

MIIFENVSKH FTIKRDRRNS IQERIAGLFK PQVLPDEDFW ALRDVSFTIN RGETVGLIGH 
NGSGKSTTLK LITRILQPNS GKVIVDGRVS ALLELGSGFH PDLTGRENIF LNGSLLGFNR 
AEMAEKVPAI IRFSEMQEFI DMPVKHYSSG MYMRLGFAVA INVDPDILIT DEVLAVGDEL 
FQRKCLDRIY QLKRRGKTIL FVSHALGQVR DLCDRALWFH HGNLMTDSTP TETIDNYLAE 
TNQRDAERIE AEKAAENPEP EAPSTEIETK TEEEIEFDAR RWGSREAEIY NVELLNAAGE 
VIQTATTGQA LTIRMHYQAH QPIEKPVFGV AIHHRTGFHI NGPNSRFAGL EIPQIAEQGY 
VDYQIENLPL LEGNYELSVA LYDHTLTHPY DHHDRKHNLR VYAASIGEQF GTIYIPSQWS 
WHK