Gene Cpha266_2339 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_2339
Symbol
ID	4569675
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	2710801
End bp	2711970
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	44%
IMG OID	639766897
Product	transposase, IS4 family protein
Protein accession	YP_912751
Protein GI	119358107
COG category	[L] Replication, recombination and repair
COG ID	[COG3385] FOG: Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACAG GAAAAACCGT TTTCGCTCAA TTGCAGGATC ATCTACCGCT CCATCAATTT 
CGCCGGTGCG TCAAGCGATA CGGTGGCAAT TATAAGGTTC AGTCGTTCAC CTGTCTCGAT 
CAATATCTTT GCCTGTTCTT TGCTCAACTG ACCTATCGGG AGAGCCTTCG GGACATCACG 
ACCTGCCTGC TCGGGATGCA GAATAAACTC TACCATATGG GCATCCGTGG CACAATTGCA 
CGAAGTACTC TGGCTGATGC CAATGAAAAA CGGGATTGGC GCATTTATCA GGACTTTGCA 
CATATACTGA TTCATCATGC AAGAGAACTG TACAGCAAAG ACTCTTTTGG TGTCACACTG 
CAGGAAACGG TCTACGCTCT GGATTCAACC ACGATCGATC TTTGCCTGGC GCTGTTTCCA 
TGGGCAAAGT TCAGAACTCA TAAGGGTGCG GTTAAAATGC ACACTTTACT GGATTTACGA 
GGCAATATCC CGTCGTTCAT CGCCATCACG AATGGGAAGG TTCATGATGT CAACATCCTT 
GATCTCCTCG TTGTTGAATC CGGCTCATTT TACATCATGG ATCGCGGTTA TGTCGATTTT 
GACAGATTGT ATGCTATTCA CCAGGCACGG GGATTCTTTG TAATCCGAGG GAAATCCAAC 
CTCTCATTTC GGCGACTATA CTCTCATTCT GTTGATAAAT CGATAGGGAT ACAATGTGAT 
CAAACCATCA AACTGACAGG GAAAGACACG GCTGTATACT ATCCTGAGCC TCTGAGGCGA 
ATCAAGTATA GTGATCCAGA AACCGGCAAG ATATATGTGT TCCTGACAAA CAACCTTGAT 
CTTGCTCCGA AGGTGATTGC CGACCTTTAC AAAAGCAGAT GGCAGATAGA ATTGTTCTTC 
AAATGGATAA AACAGCATTT ACGAATCAAG GCATTCTATG GTACATCAGA AAACGCAGTA 
AAGACGCAAA TATGGACAGC TATTTCGGTA TATGTGCTTA TTGCATTGGT GAAAAAGAGA 
CTCAATTTGG ATATAACTCT CTACACTTTT CTACAGATTC TGAGTGTCAG CGTATTCGAG 
AAAGTCGATA TTTTACAATT AGTTACGAAC TCAGCTGGCA CGATTGAGGA TACCCATACC 
TGTAACCAGT TGAATTTATT TGACTTATAA

Protein sequence

MNTGKTVFAQ LQDHLPLHQF RRCVKRYGGN YKVQSFTCLD QYLCLFFAQL TYRESLRDIT 
TCLLGMQNKL YHMGIRGTIA RSTLADANEK RDWRIYQDFA HILIHHAREL YSKDSFGVTL 
QETVYALDST TIDLCLALFP WAKFRTHKGA VKMHTLLDLR GNIPSFIAIT NGKVHDVNIL 
DLLVVESGSF YIMDRGYVDF DRLYAIHQAR GFFVIRGKSN LSFRRLYSHS VDKSIGIQCD 
QTIKLTGKDT AVYYPEPLRR IKYSDPETGK IYVFLTNNLD LAPKVIADLY KSRWQIELFF 
KWIKQHLRIK AFYGTSENAV KTQIWTAISV YVLIALVKKR LNLDITLYTF LQILSVSVFE 
KVDILQLVTN SAGTIEDTHT CNQLNLFDL