Gene Haur_3350 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3350
Symbol
ID	5735220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	4225553
End bp	4227196
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	50%
IMG OID	641280497
Product	ABC transporter related
Protein accession	YP_001546114
Protein GI	159899867
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTATTGC AGATTAACAA CCTCAACAAA GCCTATGGCC CACAGCAAAT CCTCAGCGAT 
ATCGCGTTAA TTATCAATCG TGGCGAACGA ATTGGCCTCG TTGGCCCAAA TGGCGTTGGT 
AAATCGACCT TATTGCGCTT AATTATTGGT CAAGAGCAAG CCGATGCTGG CACAATTCGC 
TGGGGCGAGG GCTGTGAATA TGGCTATTTA ACTCAGCAAT TAATCACCCC TAGCGAGCTG 
AATGTTGAGC AATTACTGGC AGCTAGCCAA CAACAACTCA GCCAACTCGG CCAACAGCTT 
GAGCAATTAA GCAACCAAAT GGCCCATGCC GACCCCGATC AACTTGCCGA TCTTTTAGAA 
CGTTATGGCG ATGTGGCCGA GCGCTTTGAG TTGCGTGGTG GCTACGAACT GGATTACCGA 
ATTGATCAGG TGCTTGCGGG CTTGGGCTTA AGCCATGTGC CCCGAGAACG CTCAGTCCAA 
GCGCTATCGG GCGGCGAGAA AACCCGACTT GGTTTGGCCG CGCTGCTAAT TAGCAACCCC 
GATGTGTTAT TGCTCGATGA ACCAACCAAT CACCTTGATC ATCAGGCTAG TGCATGGCTT 
GAAACGTGGC TCCAAGCCCA TAACGGGGCA ATCTTGGTGG TTTCACACGA TCGAGCGTTT 
CTTGATCAAG TGGCAACCAC AATTATTGAG CTTGATGAAC ATACCCATCA ACTCAAAACG 
TATCCTGGTA ACTACAGCGC CTATTTTGCC GCCAAGCAAG CTGAACGCGA ACGCTGGGAA 
GCTGATTATC AACGGCAGCA GGTCGAAATT CGCCAATTAC AAATGCGAGC CAAAGCCCAA 
AATCAACAAG TTGCCCATAA TCGAGCGCCG CGTGATAACG ATGGTTTTAT TTATCATTCC 
AAGGGCGAAA ATGTGGCGGC GGCGGTTTCA CGTAATCTGC GTTCAGCCCA ACAAGCGCTT 
GAGCGCATTT TGGCAGATCC AATTCCTGAG CCACCCAAAC CACTGGCGAT CAACCCAACC 
TTTAATCCCA GCCCCGATGG TAGCCAACAA ATGCTGTCGA TCGAAGGCGT GAGCTATCAG 
CGTGAGCAAC AGCCAATCCT CGAACAGATC GATTTGGAAT TACGGCCCCG CCAACGCATC 
CTGATTACGG GAGCCAATGG CAGCGGCAAA ACCACCTTGC TAGACCTGAT TGCCGGCGAT 
TTGCAACCAA GCACAGGCCA AATTCGCTAT GGCCCAAACC TACAAATTGG CTATTTACGC 
CAAGAATATC AGCGCCCCAA GCCTGAGCAA AGCCTATTTG AAGCCTATCG CGAAGGTTTG 
CTGGGCTTTA ATAAAGATCT GATCAACGAG CTAGTTTGGT CAGGCTTATT CCGCTATGCT 
GAAGTCAATC GGGCGGTTGG CAGCATTAGC ACAGGTCAGT TGCATAAGTT ACAATTAGCC 
CGACTGATTG CCGCACGCGC TAATTTGTTG TTGCTTGATG AACCAACCAA CCACTTAAGT 
TTTGATGTTT TAGAGCAATT CGAGGCTGCG CTCAATCAGT TTGCTGGGCC AATCATTGCG 
GTTTCGCATG ATCGGCGCTT TATTCAGCAA TTTGCTGGCG AGATTTGGCA TTTACAACAG 
GGACGGTTAA CGCGCCTATG CTGA

Protein sequence

MLLQINNLNK AYGPQQILSD IALIINRGER IGLVGPNGVG KSTLLRLIIG QEQADAGTIR 
WGEGCEYGYL TQQLITPSEL NVEQLLAASQ QQLSQLGQQL EQLSNQMAHA DPDQLADLLE 
RYGDVAERFE LRGGYELDYR IDQVLAGLGL SHVPRERSVQ ALSGGEKTRL GLAALLISNP 
DVLLLDEPTN HLDHQASAWL ETWLQAHNGA ILVVSHDRAF LDQVATTIIE LDEHTHQLKT 
YPGNYSAYFA AKQAERERWE ADYQRQQVEI RQLQMRAKAQ NQQVAHNRAP RDNDGFIYHS 
KGENVAAAVS RNLRSAQQAL ERILADPIPE PPKPLAINPT FNPSPDGSQQ MLSIEGVSYQ 
REQQPILEQI DLELRPRQRI LITGANGSGK TTLLDLIAGD LQPSTGQIRY GPNLQIGYLR 
QEYQRPKPEQ SLFEAYREGL LGFNKDLINE LVWSGLFRYA EVNRAVGSIS TGQLHKLQLA 
RLIAARANLL LLDEPTNHLS FDVLEQFEAA LNQFAGPIIA VSHDRRFIQQ FAGEIWHLQQ 
GRLTRLC