Gene Cphamn1_0043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_0043
Symbol
ID	6373686
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	-
Start bp	46330
End bp	47856
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	50%
IMG OID	642682565
Product	transposase IS4 family protein
Protein accession	YP_001958513
Protein GI	189499043
COG category	[L] Replication, recombination and repair
COG ID	[COG5421] Transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGGGG ACTTGAAAAT CAGAAAGGTG CGAACTGCAT CCGGAGCAAC TGCCGTACAA 
GTAGTCCAGA ATAAAGGGAC GGGGCGTTCT TTCCTCAAAC ATATTGGCAG TGCTCATGAT 
GAGCACGAGC TGGAATTGTT GCTGGATGAG GCAAGAAAAT TCGTCGAAGC TCATTGTCGC 
CAACCAAGCC TTTTTTCGGA TACTGATACG CCGTCTACAC CATCGCTGTT TAAGACTGTT 
CTTGACAAGT CAAGCGCTGT TGGCGTCACT CATCAGTTTG CCCGCAATGC GCTCCTTGCC 
TGTGCCCGAA AATGTGGCCT GGGCTCGTTG CCGGAGCTGT ATCTTGATCT GGCACTCATG 
CGCATCATTG AGCCAACATC GAAGTTGCGT TCGCTGGATC TTCTTGAGTC GTATTTCCAT 
GTCAGCTATG CGAAACGAAC ACTCTATCGC CTGTTCCCCA AGCTCTTGGG GTATCAGGAG 
GAGATCGAAA CCGCAGCCAT CCAAACCGCT CGAAGAGAAT TGCAGGAGCA GTTCAGTCTG 
GTACTGTACG ATGTTACCAC GCTGTACTTC GAGTCCTTCA AGGAGTACGA TTTCCAGCGT 
CCCGGATTCT CAAAGGACAA CAAACCCCAG CAGCCGCAAA TCGTCATTGG CTTGATCACC 
ACCCGCTCAG ATTTTCCTGT CATGCATGAG GCGTTTGAAG GCAACACCTT CGAAGGGAAA 
ACAATGCTCA AGGTCATTCA CCGCTTTCAG GAGCGTGTTG GCGAAACCAA GCCGATTATT 
GTGGCCGATG CCGGCATGCT CTCGAAAGAC AACATCCTGA AACTGGAGAA TGAAGGATAC 
CGCTACATCG TAGGGGCTCG GATGGCGAGT ACTGCGGTGA GCTTCATTGA TCAGGTTTAC 
AAAGCACTAC CTCGTACCGA TAAGGCTCTA CACCGCTTCA GCTACAAGTC TGCCGTAAAG 
AATGCCACCA TGATCTGTGA GTTCTCGGAG TCCCGATACA AAAAAGACAA GCGAGAGTTC 
GATAAGCAGG TCAAGCGGGC ACTTACCTTG CTTGAAAAAG ATGAACCCGG CCGACGGGCA 
AAATTCGTCA AGAAAACCAA AACAACCGAC AAGCCCTATA TCTTCGATAC CAATCTTCAG 
GCAAAGGCAG AGAAGCTTCT TGGCATCAAA GGCTATGTGA CCAATATCCC TGAGAAGGAA 
CTGTCCAGTC GTGCGGTTAT CGACTACTAT CATGATCTCT GGAACGTAGA GCAGGCTTTT 
CGCATGAGCA AATCCGACCT ACAGGCCAGA CCGATCTTTC ATCACACGGA AGATGCCATT 
AGGGCTCATA TGCTCGTCTG CTTTATGGCC TTGATGATGG GCAAACTTCT CGAAATAAAA 
ATGGGTCGAT CGTTACGCCA GATTCGGGAA AAAATCTGGG CGGTTCATGA AATCCATCTT 
TGCTATGAGC GAACCGGTGA GGTTTGTGTC ATGCAGATGG GCACAAGCGA ATTTACCAAC 
AAGATTCAAC GATTTCTTGA GCTCTGA

Protein sequence

MRGDLKIRKV RTASGATAVQ VVQNKGTGRS FLKHIGSAHD EHELELLLDE ARKFVEAHCR 
QPSLFSDTDT PSTPSLFKTV LDKSSAVGVT HQFARNALLA CARKCGLGSL PELYLDLALM 
RIIEPTSKLR SLDLLESYFH VSYAKRTLYR LFPKLLGYQE EIETAAIQTA RRELQEQFSL 
VLYDVTTLYF ESFKEYDFQR PGFSKDNKPQ QPQIVIGLIT TRSDFPVMHE AFEGNTFEGK 
TMLKVIHRFQ ERVGETKPII VADAGMLSKD NILKLENEGY RYIVGARMAS TAVSFIDQVY 
KALPRTDKAL HRFSYKSAVK NATMICEFSE SRYKKDKREF DKQVKRALTL LEKDEPGRRA 
KFVKKTKTTD KPYIFDTNLQ AKAEKLLGIK GYVTNIPEKE LSSRAVIDYY HDLWNVEQAF 
RMSKSDLQAR PIFHHTEDAI RAHMLVCFMA LMMGKLLEIK MGRSLRQIRE KIWAVHEIHL 
CYERTGEVCV MQMGTSEFTN KIQRFLEL