Gene Haur_2046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2046
Symbol
ID	5733935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	2557730
End bp	2558875
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	59%
IMG OID	641279190
Product	putative transposase
Protein accession	YP_001544817
Protein GI	159898570
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.367263
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCACGC TCAACGCCAT TGTCCAGCGC TATGGTCCGG CCTATTGGGC CACCCCGCCA 
GCGCCGATCA GTCCTGACCA ACGCCGGGTG CTCCATGCCC TGGATGCATG TCGGACGGAG 
CACCTAGGCG GTCAGGTGTT CATCTGCCCC CACTGTCACA TAGCCCGCTA CAGCTACCAT 
TCATGTCGGA ACCGACATTG TCCCACCTGC CAACACGATG CTGGCCAAAC CTGGTTGGCC 
AAGCAACAGG CGCTGCTGCT GCCCGTCCCC TACTTTCTCG TCACGTTTAC CTTGCCGGCG 
GAACTCCGGG CGTTTGCGGC GGCCAATCAG CGCCAGGTCT ATGATTGTTT CTTTCGGGCC 
TCAGCTGCGG CACTCCAGCA GCTAGCCCAC GATCCTCGGC TGCTCGGCGG GCAATTGGGG 
ATGCTGGGCA TCCTGCAAAC CTGGACGCGC GACCTGCGCT ACCATCCGCA TATCCACTAT 
CTCATTCCGG CTGTTGTCCG TACCCCCGAT GGCACCATCT GCCAGCCTGC CCCAGGGTTC 
CTGCTCCCCG TGCGGCCCTT AGCGCTGCTA TTTCGCGGCA AACTGCGTGC TGCCATCGGC 
CAACTTCCGG GCGGCACGAC CCGTGATTCG GCGATCTGGC AGCGCCCATG GGTCGTCGAT 
TGTCGCCCAG TTGGCACCGG TGAAACAGCC TTGAAATACT TGGCACCGTA CATCTTCCGG 
GTGGCCTTGA GCAACAATCG GCTCCTCAGC ATGGATCATG ATAACGTGAC CTTTCGCTAC 
ACCAATGGGC AGACGCACCA GACCTGTACC AAAACCCTCT CGGCACTGAC ATTTCTCGAG 
CAATTTCTTC AACACGTCTT GCCAAAAGGC TTTGTCAAAG TGCGTTATTT TGGCTTGTTT 
TGTCCCGCCA AGCGGGCGTT CCTCCGCCGC ATCCGCGCCC AATTGATGCT CTCCCGTGGA 
CAGGAGTTCA GTCAGCCACC CGTCATTCAT TGCCTGCAGG AAGCACCGCT GTGCCCGCAG 
TGCGGTGCTG TGATGCGACG CCAAGAACTT CCGGTGGTTT GTCAAGAAGT GTGCAAAATC 
AAATTAGCCA GGCATGCGAA TTTTCCGAAG CTGAAGTGTT CGAACAACGG CATAAAACAG 
CAATAA

Protein sequence

MITLNAIVQR YGPAYWATPP APISPDQRRV LHALDACRTE HLGGQVFICP HCHIARYSYH 
SCRNRHCPTC QHDAGQTWLA KQQALLLPVP YFLVTFTLPA ELRAFAAANQ RQVYDCFFRA 
SAAALQQLAH DPRLLGGQLG MLGILQTWTR DLRYHPHIHY LIPAVVRTPD GTICQPAPGF 
LLPVRPLALL FRGKLRAAIG QLPGGTTRDS AIWQRPWVVD CRPVGTGETA LKYLAPYIFR 
VALSNNRLLS MDHDNVTFRY TNGQTHQTCT KTLSALTFLE QFLQHVLPKG FVKVRYFGLF 
CPAKRAFLRR IRAQLMLSRG QEFSQPPVIH CLQEAPLCPQ CGAVMRRQEL PVVCQEVCKI 
KLARHANFPK LKCSNNGIKQ Q