Gene Cpha266_1939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_1939
Symbol
ID	4570053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	2245794
End bp	2248646
Gene Length	2853 bp
Protein Length	950 aa
Translation table	11
GC content	49%
IMG OID	639766521
Product	excinuclease ABC subunit A
Protein accession	YP_912379
Protein GI	119357735
COG category	[L] Replication, recombination and repair
COG ID	[COG0178] Excinuclease ATPase subunit
TIGRFAM ID	[TIGR00630] excinuclease ABC, A subunit

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0317613
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACAC AACGGCTTGC CGATACCGAC TTTGCTGAAT CGGTTCTTCC TGATATCGTG 
CTCAAGGGCG TTTGCACGCA TAATCTTAAA AACATCACCG TTCATATTCC CCGAAACCGG 
TTTGTTGTTC TCACAGGAGT CAGCGGATCG GGAAAGTCCA GTCTTGCGTT TGACACACTC 
TATGCAGAAG GTCACCGACG TTATGTTGAA TCGCTCTCGG CATATGTTCG TCAGTTTCTT 
GAGCGCATGC CTAAACCTCC GATCGAAATT GTCGAAGGTA TCGCTCCGGC TGTCGCCATC 
GAGCAGAAGC CCATTCCGAA AAATCCTCGT TCGACCGTTG GCAGTGTTTC GGAGATATAC 
GATTATCTGC GTCTTCTTTA CGCAAGGGTT GGTAAAATCT ATTCGCGTGA TACCGATGAG 
CTGGTTCTGA AGCATACCCC GGATGATGTG AGCTTGCAGG TGCGCTATTT TGACGAGGGG 
GCAAAATTCT ATGCGGGCTT TCCATTTCCA TGTCATACAG ATGAGGCTCA TCATGATTGT 
TCGGCCAAGG ATGAAATAGA GAATCTGCTC AAGAAAGGTT TTTTCAGGAT TATTGACGGC 
GATACGGTGC TGGATCTTAA TGACGCAGCG GTCTGTAACC GTCTCAAGTC GATGAATCAT 
CTCGAACTGT CGTCATTGCT TGTTCTTGTT GACAGGTTTG TTACGCGACA TGAGGATAAA 
CTTTATCACC GGGTCGCCCA GGCTGCAGAG ACAGGATTCA TGGAATCCGG CGGGTATGTT 
GTGCTGAGAG TGGTTGGCGG AAAAACCTAC CGGTTCAGCG ATAAACTTGA GCTTAACGGT 
ATTGAATACC TGGAGCCCTC TCCGCAGCTT TTTGCGTTCA ACTCTCCGAT CGGGGCCTGC 
AAAAAGTGCC AGGGATTCGG ACGTATAGCA GGCATTGATG AAGATGCTGT TGTTCCCGAT 
AAATCGCTGA GTCTTTTCGA AGGAGCAATT GTCTGCTGGA ATTCCGAAAA GTACCGCTGG 
AACCTGAAAC AGTTGCTTGC TGCGGCACCG GAAGCGGGCA TTCCTCTTGA TGTTCCATAC 
GAAAAACTCT CTGCAGCCAA TAAGGAGCTT ATCTGGAAGG GTATACCCGG TAAGCGGTCG 
GAGTACAAGG GGATCTGGGC GTTTTTTGCG GAAATCGAAA AGGATGCCGG GTATAAAATG 
CATTATCGGG TATTCCTGAG CCGTTATCGG GGGTATGCTA CCTGTCCCGA ATGCGAGGGA 
TCGCGTCTCA ATCTCGATGC AAGGCTGGTA AGGGTATCCG GCAGGAATAT CTCTGAAGTC 
ACCCGCATGA ATATTGCGGA AGCTCGCAAC TTTTTTCTGA ACCTTGATAT CTCTCCGTTT 
GACAGAAAGG TTGCAGAGGC GATTCTGGAG GAGATCATCA AGAGGCTTGG CTATCTTCTC 
GATGTTGGTC TCGATTATCT TACCCTTGAC CGTCTGACCC ATACGCTTTC CGGAGGAGAG 
TTTCAGCGGA TCAATCTCTC CACCTCCATA GGTTCGCCAT TGGTAGGGGC AATCTATGTT 
CTTGATGAAC CGAGCATCGG TCTTCATCAG AGTGATTCGT CCAAATTGAT CGCGCTGCTT 
AGAAAATTGC GTGATCTTGG AAACACTGTT GTTGTGGTTG AACACGACCG TGAGATTATT 
GAGGCGGCTG ACGAGGTGAT CGATCTCGGG CCGAAAGCTG GTCGTCTGGG CGGTGAGGTT 
GTTTTTCAGG GGACGATCAG CGAGATGAAG GCCTCCGGAA ATTCACTTAC AGCGGAGTAT 
CTGAACGGTG AAAAGGAAAT TGCGGTACCC AAAGATCGAC GGAAAGCTGA CTTTTCATCC 
TGCATCTCCA TAAAGGGGGC CATGCAGAAT AATCTGAAAA ATATCGATGT CCGGTTTCCT 
CTCGGTATTA TGACCTGCGT TACCGGCGTG AGTGGTTCAG GCAAGTCAAC TCTCGTTAAC 
GATATTTTGA AAAACGGACT TCTCAAACAG AAAGAGGGTT TGAAAGAGAA GGTCGGAACA 
CATCGTTCAA TTGGCGGCGT GGAACTGATA GACCGTATTG AGCATGTTGA TCAGTCGCCG 
ATAGGAAAAT CCAGTCGCAG CAATCCTGTT ACCTATCTGA AAATATTCGA TGACATAAGG 
ATGCTGTTTG CCCAGACTGT TGAGGCAAAG GCGAGGGGGT TGCATGCTGG CTATTTTTCC 
TTCAATATTC CTGGTGGCCG ATGCGAGGCA TGCGCCGGAG AGGGAGTTGT CAGGATCGAG 
ATGCAGTTTC TTGCCGATAT CGAAGCCGTT TGTGAAGAGT GCGGCGGATC GCGCTACAAA 
CAGGAGACTC TTGAGATCAC TTTCAATGGT CGATCGATTA TGGATGTTCT CGATCTCACG 
GTCAGTGAAG CGATTGAGTT TTTCAATGGT GAAAAAAATG TTTTGCGCAA GTTGCAGGTG 
CTTGAAGAGG TTGGTCTCGG CTATATCCGT CTTGGACAGT CATCCAGCTC GCTTTCGGGT 
GGTGAAGCAC AACGGTTGAA GCTTGCCAGC TTTATTGCGC ATGCCGATAC CCGGCACACC 
CTTTTTCTGT TTGATGAACC TACTACCGGG CTGCATTTCG AAGATATCAG CAAGCTGATT 
CGCTGTTTTG AGAAACTGCT TGAGCAGGGA AATACACTGG TTATTATCGA GCATAATCCC 
GATATCATCA AGCAGGCAGA CTGGGTTATC GATCTCGGGC CGGGAGCGGG AGACAAGGGA 
GGATCCATCA TGGCCGAAGG CACTCCCGAA AAAATTGTCG AGTGCAAGGA GTCTTTGACG 
GGCTTGCATC TCAAGCCCTA CCTGCATTCA TGA

Protein sequence

MTTQRLADTD FAESVLPDIV LKGVCTHNLK NITVHIPRNR FVVLTGVSGS GKSSLAFDTL 
YAEGHRRYVE SLSAYVRQFL ERMPKPPIEI VEGIAPAVAI EQKPIPKNPR STVGSVSEIY 
DYLRLLYARV GKIYSRDTDE LVLKHTPDDV SLQVRYFDEG AKFYAGFPFP CHTDEAHHDC 
SAKDEIENLL KKGFFRIIDG DTVLDLNDAA VCNRLKSMNH LELSSLLVLV DRFVTRHEDK 
LYHRVAQAAE TGFMESGGYV VLRVVGGKTY RFSDKLELNG IEYLEPSPQL FAFNSPIGAC 
KKCQGFGRIA GIDEDAVVPD KSLSLFEGAI VCWNSEKYRW NLKQLLAAAP EAGIPLDVPY 
EKLSAANKEL IWKGIPGKRS EYKGIWAFFA EIEKDAGYKM HYRVFLSRYR GYATCPECEG 
SRLNLDARLV RVSGRNISEV TRMNIAEARN FFLNLDISPF DRKVAEAILE EIIKRLGYLL 
DVGLDYLTLD RLTHTLSGGE FQRINLSTSI GSPLVGAIYV LDEPSIGLHQ SDSSKLIALL 
RKLRDLGNTV VVVEHDREII EAADEVIDLG PKAGRLGGEV VFQGTISEMK ASGNSLTAEY 
LNGEKEIAVP KDRRKADFSS CISIKGAMQN NLKNIDVRFP LGIMTCVTGV SGSGKSTLVN 
DILKNGLLKQ KEGLKEKVGT HRSIGGVELI DRIEHVDQSP IGKSSRSNPV TYLKIFDDIR 
MLFAQTVEAK ARGLHAGYFS FNIPGGRCEA CAGEGVVRIE MQFLADIEAV CEECGGSRYK 
QETLEITFNG RSIMDVLDLT VSEAIEFFNG EKNVLRKLQV LEEVGLGYIR LGQSSSSLSG 
GEAQRLKLAS FIAHADTRHT LFLFDEPTTG LHFEDISKLI RCFEKLLEQG NTLVIIEHNP 
DIIKQADWVI DLGPGAGDKG GSIMAEGTPE KIVECKESLT GLHLKPYLHS