Gene Haur_5164 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_5164
Symbol
ID	5737122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009973
Strand	-
Start bp	239251
End bp	240375
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	57%
IMG OID	641282329
Product	putative transposase
Protein accession	YP_001547920
Protein GI	159901674
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTTCCC TCAACGCCAT TATCCAGCGT TTTGGTGCAT CGTATCGGAC TCACTGCCAT 
GGGCGACTCT CGGTGCAACA ACGACGGGTC ATCAGCGCGA TCGCAGCCTG TCGGACAGAG 
ACCCTTGGTG GTCAGGTCTT CACCTGTCCT ACCTGTCAGA CGACTCGCTA TAGCTACCAT 
TCGTGTCGTA ATCGCCATTG TCCGACCTGT CAACAGGATG CTGGAGCCGC ATGGTTGGCC 
GACCAACAAG CGCTGCTGCT GCCCGTTCCC TATTTCTTAG TCACGTTTAC GGTGCCTGCC 
GAACTGCGAC CAATCGCTCT TACCAATCAA GCGCTGCTGT ATGCGGCCAT GTTTCGGGCA 
TCGGCTGCCG CACTCCAACA ACTTGCCGCC GATCCGCGCC ACTTGGGTGG CCAATTGGGG 
ATGCTCGGCA TCTTCCAGAC CTGGACGCGC GATTTGCGCT ACCATCCGCA CATTCATTAT 
TTGATCCCCG GCGTTGGACG AACCACTGAC GAACGGATTG TCTTTCCTCC TGCTCCAGAT 
TTTTTGCTTC CTGTTCGCCC CTTAGCCATG ATCTTCCGCG CCAAACTTCG CGCCGCGCTA 
CGCCAAACAG CGATCGCTGC GACCATTCCC TCGACGGCGT GGGAGCATGA CTGGGTGATT 
GATTGCCGTC CCGTGGGCAC CGGTGAAACA GCGCTCAAAT ATCTCGCTCC GTATATTTTC 
CGCGTGGCGA TGAGTAATAA TCGCATCGTC AGCGCTGATG AGACACAGGT CACCTTTCGC 
TATCGGCACA GCGCGAGTGG CGAAAACCGA ACGAGCACAC TCCCAGTGGA GACCTTCCTT 
GATCGTTTTG TTGCCCATAT TTTGCCAAAA GGGTTTGTCA AAGTGCGCTA TTATGGTTTT 
TTTCGGACAG GAGTCCGCGC GAGCCTGCGA CGCATTCGGG CACAATTGAT GCTCTTCCGC 
AGCCACGATC TGCTGGATCG GGCGATTCCG CAACCAAAAC TGTCGGCTCA GACCCACCAG 
CTGAGCACAT GCCCGGCCTG TGGATCACTG ATGCACGGTC GGCAAATCGT CTCCAGTCGC 
ACACGTGCCC CGCCCCATGG GATGCATCAT CCTCGTTCTG CGTGA

Protein sequence

MISLNAIIQR FGASYRTHCH GRLSVQQRRV ISAIAACRTE TLGGQVFTCP TCQTTRYSYH 
SCRNRHCPTC QQDAGAAWLA DQQALLLPVP YFLVTFTVPA ELRPIALTNQ ALLYAAMFRA 
SAAALQQLAA DPRHLGGQLG MLGIFQTWTR DLRYHPHIHY LIPGVGRTTD ERIVFPPAPD 
FLLPVRPLAM IFRAKLRAAL RQTAIAATIP STAWEHDWVI DCRPVGTGET ALKYLAPYIF 
RVAMSNNRIV SADETQVTFR YRHSASGENR TSTLPVETFL DRFVAHILPK GFVKVRYYGF 
FRTGVRASLR RIRAQLMLFR SHDLLDRAIP QPKLSAQTHQ LSTCPACGSL MHGRQIVSSR 
TRAPPHGMHH PRSA