Gene Ppha_2029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ppha_2029
Symbol
ID	6462895
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pelodictyon phaeoclathratiforme BU-1
Kingdom	Bacteria
Replicon accession	NC_011060
Strand	-
Start bp	2118667
End bp	2120313
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	49%
IMG OID	642728225
Product	transposase IS4 family protein
Protein accession	YP_002018855
Protein GI	194337061
COG category	[L] Replication, recombination and repair
COG ID	[COG5421] Transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.417393
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACGTCG ATTCCAGCAA GACCACCATT AATGGCAAAA CCTACCAGCG CCATCTTTTT 
CGTGAATCCT ATCGTGAAGA TGGGAAGGTG AAAAATCGCA CGTTGGGCAA GATCTCAAAA 
TGTTCGGAAG GAGAGATTGC CGCCATTAAA CTTGCCCTGA AGTACAAAGA CAATTTGGCA 
GCCCTGTTGC ATATTGAGGA TGTTGAACTA CATGAGGGGC TTCGTGTTGG TGTGGTATAT 
GCACTCAAAA CTCTTGCCGA GAGGCTTGGT ATCAGCAAGA CGCTTGGTAA TACCCGCCAG 
GGAAAGCTTG CATTGTGGCA GATTATGGCT CGATTGATCG GGCAGGGTTC ACGACTCGGT 
GCGGTCAGGA TGGCAGCAAG TTATGGCGCC TGTGATGTCC TTGAATTAGA ACGCTTTACA 
GAAGATGACC TCTATGCCAA CCTGGCTTGG TTGACGGAGC ATCAGGAGCG CATTGAGCAG 
CAGTTATTCA AGCACAATTC AGCGGGTGCT GGCCCGGAAT TGTTGCTCTA TGATGTTACC 
TCATCATATC TTGAAGGGAT GGAGAATGTG CTTGCTGCCT TTGGCTACAA CCGGGATGGC 
AAAAAGGGGA AAAAGCAAAT CGTTATTGGT TTGTTGTGTA CCGCAGATGG CGATCCGGTT 
GCTGTCCGGG TCTTTGCAGG CAATACCGGC GACAAGTCAA CCGTTGCAGA GCAGATTCGC 
ACCGTTGCCA ACACTTTTGG CATTGAAGAG GTAACGATGG TTGGCGACAA GGGTATGATC 
AAAACGCCGC AGGCCAAAGA GTTGACCGAT GCGGGATTTT ATTACATCAC CTCACTCTCG 
AAACCCGAAA TCAGAACCCT GCTGAAGGCA GAGGTACTGC AAATGGATTT TTTCGATTCA 
GAGCTGTATG AGGTTGAAAA TAAAACCGAT GGCGTTCGAT ATGTGCTGAG AAGAAATCCG 
GTTCGAGAGG CCGAGATGGC AAAGAATCGC CAGGAACGGG TGAAAAAAAT CCAGCGTCTT 
GTTGAGGAGA AAAACAGTTA CCTCGCCGGT TCCCTCAAGC GTGACAAGGA TGTTGCACAA 
CGCTCTCTTC AGAAAAAGAT CAGCCAGTAT AAGCTCAATG ATGTGCTGGA ACTGACCCAT 
CAGGAGAGGG TGTTCACGGT AACGGTCAAT GAAGAAATCC TGAAAGGAGT CGCTCTGCTG 
GACGGCTGTT ATGTGATCAA AACCGATGTC AAGAAAGAGC TGCTTTCGAC CGAACAAGTC 
CATGATCGGT ACAAAGATCT GGCCAAAGTG GAGCATGCAT TCCGGACGTT CAAGCAAAGT 
CATCTTGAAA TCAGACCGGT TCATGTGCGA ACCGAAGCGA GCACTCGTGG CAATGTCTTT 
GCCGTTATGC TTGCCTATAA AATCGAGAGG CAGTTATCAG AACTCTGGAA AAAATGTGAA 
TGCACGGTAC CGGAAGGAAT TGATGAACTT GGCGCAATAC GCAGCACAAT CGTCACCCTC 
AAAGGGTCAA GCTGTCAGAA AATTCCCCAG TCGAAAGGAT TGGCTGCTGA GTTGCTTGCC 
GCTGCCGGGA TTACCCTTCC TTCGGTCATT GATGCCAAAA ATGTTGATGT AGTCACAAGG 
AAAAAACTGG CCCCGAAGCG TAAATAA

Protein sequence

MYVDSSKTTI NGKTYQRHLF RESYREDGKV KNRTLGKISK CSEGEIAAIK LALKYKDNLA 
ALLHIEDVEL HEGLRVGVVY ALKTLAERLG ISKTLGNTRQ GKLALWQIMA RLIGQGSRLG 
AVRMAASYGA CDVLELERFT EDDLYANLAW LTEHQERIEQ QLFKHNSAGA GPELLLYDVT 
SSYLEGMENV LAAFGYNRDG KKGKKQIVIG LLCTADGDPV AVRVFAGNTG DKSTVAEQIR 
TVANTFGIEE VTMVGDKGMI KTPQAKELTD AGFYYITSLS KPEIRTLLKA EVLQMDFFDS 
ELYEVENKTD GVRYVLRRNP VREAEMAKNR QERVKKIQRL VEEKNSYLAG SLKRDKDVAQ 
RSLQKKISQY KLNDVLELTH QERVFTVTVN EEILKGVALL DGCYVIKTDV KKELLSTEQV 
HDRYKDLAKV EHAFRTFKQS HLEIRPVHVR TEASTRGNVF AVMLAYKIER QLSELWKKCE 
CTVPEGIDEL GAIRSTIVTL KGSSCQKIPQ SKGLAAELLA AAGITLPSVI DAKNVDVVTR 
KKLAPKRK