Gene Xaut_3039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Xaut_3039
Symbol
ID	5424127
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Xanthobacter autotrophicus Py2
Kingdom	Bacteria
Replicon accession	NC_009720
Strand	-
Start bp	3377071
End bp	3378492
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	60%
IMG OID	640882285
Product	transposase IS4 family protein
Protein accession	YP_001417926
Protein GI	154246968
COG category	[L] Replication, recombination and repair
COG ID	[COG3666] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.409496
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTTTA TTGAGGGACT CGCGCGAGAT CAGGTCAACC TGCTTCCTCC TTGTGTTGAT 
GACTATGTTT CCCCGGACGC ATTGGTCCGA GTCGTCGATG CTTTTGTTAC CAGCTTGAAC 
TTGGCTGAGC TTGGCTTCGG TCGCGCTATC GCTGCGGTCA CCGGCCGCCC TGGATACCAT 
CCAGGCGATA TGCTCCGGCT GTACATCTGG GGCTACCTCA ACCAGGTACG GTCCTCACGC 
CAATTGGAAC GAGCGTGTGT CCGCGACCTC GAAGCGCTTT GGCTAATGCG CCGGCTCGCC 
CCGGATTACC GAACGATCGC CTCCTTTCGT CATGACAATC CGGAAGCCAT TGTCGGCGCC 
AGCGCTGCAT TCATCCAGTT CTGCCGCGAA ACCGGCTTGA TCAGCGGTCG ATTGGTCGCG 
CTGGACGGGA CGAAGATGCG CGCGGTCGCG AGCCCAAAGA ACATCGCTGG CGCCGACCGG 
CTGGCCCGTG ACGTTGCGCA CACCGAAAAG GAGATCGCCT ACTACCTTGA ACGGCTCGAC 
ATCATAGATG AGGCAGTGGC CCAGGGGTTC GACGATCAGC CCAAACATCG GGAGGCGTTC 
ACCACTGCGA TGGAGACCCT CGGGCGCCGC AAAGACAGGC TCGTGCGCCG GCAGGACATC 
CTGAAGGATC GCGACGAGAC GGCTTTGGTC TTTGGCGAGT CCGACGCGCG GCCGATGGGC 
TATGGACGTT CTCCCAAGAC ACCCTGCTAC AACATGCAAA GCGTGGTCGA TGTAGATAGC 
GGCCTGATCA TACATCACGA CGTGACCAAC GAGGCAAACG ACAGCCAGCT CCTGCATCCA 
ATGTCGATGG CGACGATGGA GGTGCTTGAG GTTGACGAGC TCAAAGTCCT GGCCGACGGC 
GGTTACTCCA ACGCCCAGGC GGTCGCGCAA TGCGAGCGCG ACCATATTGA GGTCGCGGCG 
CCGATCAAAC GCGGCGCCAT GAGCACCGAC TTTTTCCGGC CAGCGCAGTT CGTGTATGAT 
GAGGAGACCG ACACAATCCG GTGCCCCGCC GGCAAGACGT TGAGACCATC CGGCAAACAT 
ACCCGCAACC GTGCGATCCG ATATAGAACG CCCGCATGCA AAGACTGTCG GCTGAAGAGC 
CGATGCACGT CCGGCGCCCA ACGGACCATC CATCGGTTGT TCGATCAGGC GGCGCTGGAT 
CGTATGGAGG CCAGAATCTA CGCGGATCCG AGCTTGATGG TGACCCGCCG ATGTACTGTA 
GAGCACCCCT TCGGCACGAT TAAACGGATG TCCGGCGGCG GAAGGTTCCT CACGCGAGGT 
CTCAGAGCGG TAAAGGCCGA AGCGGCTCTC TCGATTGTCG CCTTCAACAT CCTCCATGCA 
GTAAATGCCT TCGGTGCCGA GCGACTGACG CCAGCGGGGT GA

Protein sequence

MSFIEGLARD QVNLLPPCVD DYVSPDALVR VVDAFVTSLN LAELGFGRAI AAVTGRPGYH 
PGDMLRLYIW GYLNQVRSSR QLERACVRDL EALWLMRRLA PDYRTIASFR HDNPEAIVGA 
SAAFIQFCRE TGLISGRLVA LDGTKMRAVA SPKNIAGADR LARDVAHTEK EIAYYLERLD 
IIDEAVAQGF DDQPKHREAF TTAMETLGRR KDRLVRRQDI LKDRDETALV FGESDARPMG 
YGRSPKTPCY NMQSVVDVDS GLIIHHDVTN EANDSQLLHP MSMATMEVLE VDELKVLADG 
GYSNAQAVAQ CERDHIEVAA PIKRGAMSTD FFRPAQFVYD EETDTIRCPA GKTLRPSGKH 
TRNRAIRYRT PACKDCRLKS RCTSGAQRTI HRLFDQAALD RMEARIYADP SLMVTRRCTV 
EHPFGTIKRM SGGGRFLTRG LRAVKAEAAL SIVAFNILHA VNAFGAERLT PAG