Gene Cphamn1_0829 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_0829
Symbol
ID	6374496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	+
Start bp	892653
End bp	893711
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	47%
IMG OID	642683337
Product	transposase IS4 family protein
Protein accession	YP_001959261
Protein GI	189499791
COG category	[L] Replication, recombination and repair
COG ID	[COG3039] Transposase and inactivated derivatives, IS5 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAACA TCAATCCTCT TGGCCTTTTC GACGAACATT TTCTGCTGGA ACGGCTCACC 
AAGCTCAAAG ATCCATTGGT AAAACTGGAT ACATATATCG ACTGGAACAT CTTTGCGCCT 
ATCCTGAATG TTGTCTTCAG TAAGCCTGAA AACAGTAGCA AAGCAGGTCG CCCTCCGTTT 
GATAGAGTCA TGATGTTCAA ACTGCTCATT CTACAAAGCT TGTATAGTCT CTCCGATGAT 
CAGATGGAGT TCCAAATAAC AGACAGGCTG AGCTTCAAGC GATTTCTGAA GCTGAAGACC 
ACCGACAAGG TTCCCGACAG CAAGACCATC TGGAAGTTCC GTGAAACCCT CATCCAAGAA 
GGGGTTATCG AAGCTCTGTT TCACCGGTTC AATGAGGCCC TTGACGACCA GTCCGTCTTT 
GCAAATACCG GCCAGATTGT CGATGCCAGT TTTGTTGAAG TGCCCCGTCA GCGCAACACA 
CGGGACGAGA ACCAGCAGAT CAAGAAAGGC GAAACCCCTG AAGCTTGGAA AGCAAGACCC 
AACAAACTTC GTCAAAAAAA TCGTGACGCC CGCTGGACCA AGAAAAATAA GATGTCTTTC 
TATGGCTACA AGAACCATAT AAAAGCCGAC AAGGGAACAA AGCTCATCAG CGACTACATG 
GTTACCGATG CTTCAGTTCA TGATTCACAG GAGCTTGAAA CCCTTATCAG TACCGACGAT 
GGCGGTCAGA AGCTGTACGC AGACGCAGCC TATATTGGAC AGGAAGAAAC TATCGAAAGC 
AGTGGTATGA GGAATATGGT TCATGAAAAA GGCAACAGGT ACCATAAACT CACCGATGCC 
CAGAAGGCTT CGAACAAAGA AAAGTCTCGT ACCCGCGCCA GAGTTGAACA TGTGTTCGGC 
TTCATGACCA ATTCTATGAA CGCCATGTCC ATCAGAACCA TTGGCTACAT ACGGGCAACA 
GGCAAGATTG GATTAGCCAA CTTGACCTAT AACATGATGC GCTGCACACA GTTGAAGAAG 
AAAGTGCACA ATGTTTTCCT GCGGGATAGC TACGCCTAA

Protein sequence

MKNINPLGLF DEHFLLERLT KLKDPLVKLD TYIDWNIFAP ILNVVFSKPE NSSKAGRPPF 
DRVMMFKLLI LQSLYSLSDD QMEFQITDRL SFKRFLKLKT TDKVPDSKTI WKFRETLIQE 
GVIEALFHRF NEALDDQSVF ANTGQIVDAS FVEVPRQRNT RDENQQIKKG ETPEAWKARP 
NKLRQKNRDA RWTKKNKMSF YGYKNHIKAD KGTKLISDYM VTDASVHDSQ ELETLISTDD 
GGQKLYADAA YIGQEETIES SGMRNMVHEK GNRYHKLTDA QKASNKEKSR TRARVEHVFG 
FMTNSMNAMS IRTIGYIRAT GKIGLANLTY NMMRCTQLKK KVHNVFLRDS YA