Gene Acid345_4223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4223
Symbol
ID	4073149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	5005353
End bp	5006723
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	58%
IMG OID	637986254
Product	primary replicative DNA helicase
Protein accession	YP_593297
Protein GI	94971249
COG category	[L] Replication, recombination and repair
COG ID	[COG0305] Replicative DNA helicase
TIGRFAM ID	[TIGR00665] replicative DNA helicase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.838486
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.367922
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAACCG TCAATCAAAG TTTGGATCGT GGGCTTCCCG CCGCCATCGA CGCTGAGAAG 
TCAATCCTCG GCGCCATCCT TCTCGAGAAC AGTACATACG ACCAGACCAC CGGGCTAAAG 
TCTGAGGATT TTTATCTCGA CGGGCACCGG CGCATCTTCG GGGCGATGAT CGACCTGCGC 
GAGACGTCGC GGGCGATCGA CATCATCACG ATCACGGATG AGTTGGGCCG GCGTAAAGAC 
CTTGAGGCGT CGGGAGGTGT GGCGTATATC GCGTCGCTGA CGGACGGAGT GCCGCGGCGG 
CCGAGCATCG AGCAGTACGT CAAGATTGTG CGCGATAAAT CGATGCTGCG GGCGCTGATT 
CATGCCTGCA ATAACACGAT GTCGCAGGCC ATCGACCAGG CCGACTCGGT CGAGGACATT 
CTTGACCAGG CTGAAGCAAA CGTCTTCGCG ATTTCCCAGG GCCGGGTCAG CAACGACTTC 
AAGGACATCG CTTCGATCGT GAAGGATTCG TTCGGGTCGG TGGATGCGCT GCTGAAGCGT 
GGGCAACGCA TTACGGGACT GGAGACGCAC TTCGCCGATC TTGATGGGCT CACCAGCGGG 
TTCCAGCCAT CGGATTTGAT CATCATCGCC GCGCGTCCTT CGATGGGCAA GACCGCGTTT 
GCGATGAACA TTGCCGAGAA TGCGGCAGTC ATGGACGGCA AGGTCGTCGG CATCTTCTCG 
CTGGAAATGT CGCGTGAAGC GCTGCTGCTA CGTATGTTGT GTTCGCAGTC GCAGGTGAAC 
TCTCACAACA TGCGCACCGG GTTCCTCGGC AGGGAGGACA TCGGCAAACT GCAGGGTGGC 
TTGGAACGGC TGCTGCGAGC GCCGTTGTAC ATCGACGACA CGCCGGGAAT TTCCGTGAGC 
GAAATGCGGG CGAAGGCGCG GCGACTGGCG CAGATGAGGG GTACGCTCGA CCTGATCGTT 
GTGGACTATC TACAGCTCAT GTCCGGTACT CCGATAGGCG GCAAGCGATT TGAAAATCGC 
ACTCAGGAAG TTTCGGCGAT TTCGCGTGGT CTGAAAGCCG TAGCGAAGGA ACTGCGGGTG 
CCGGTAGTCG CGCTTTCGCA GTTGAGCCGT GCGCCAGAGC AGCGCGGCGG CAAAGACAAC 
GAACCGAAAC TTTCGGATTT GCGTGAATCG GGTTCGATCG AGCAAGACGC GGACGTAGTG 
ATGTTTTTGT ATCGTCCGGA ATATTATGAC CGCGAGAATG TGGACCTGGA AGGCATCGCG 
AAGCTGATCA TCGGCAAGCA GCGTAACGGC CCCACCGATA CGGTGCAGCT GGCGTTCCAG 
AAAGAGTTCA CCAAGTTCAT GGATCTCGAC CGGCAAGCTT GGGTCAAGTA G

Protein sequence

MATVNQSLDR GLPAAIDAEK SILGAILLEN STYDQTTGLK SEDFYLDGHR RIFGAMIDLR 
ETSRAIDIIT ITDELGRRKD LEASGGVAYI ASLTDGVPRR PSIEQYVKIV RDKSMLRALI 
HACNNTMSQA IDQADSVEDI LDQAEANVFA ISQGRVSNDF KDIASIVKDS FGSVDALLKR 
GQRITGLETH FADLDGLTSG FQPSDLIIIA ARPSMGKTAF AMNIAENAAV MDGKVVGIFS 
LEMSREALLL RMLCSQSQVN SHNMRTGFLG REDIGKLQGG LERLLRAPLY IDDTPGISVS 
EMRAKARRLA QMRGTLDLIV VDYLQLMSGT PIGGKRFENR TQEVSAISRG LKAVAKELRV 
PVVALSQLSR APEQRGGKDN EPKLSDLRES GSIEQDADVV MFLYRPEYYD RENVDLEGIA 
KLIIGKQRNG PTDTVQLAFQ KEFTKFMDLD RQAWVK