Gene Acid345_3862 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3862
Symbol
ID	4071014
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4572245
End bp	4573306
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	61%
IMG OID	637985886
Product	condensin subunit ScpB
Protein accession	YP_592936
Protein GI	94970888
COG category	[K] Transcription
COG ID	[COG1386] Predicted transcriptional regulator containing the HTH domain
TIGRFAM ID	[TIGR00281] segregation and condensation protein B

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.857603
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCTTA AGGGAAAAAT CGAAGCAATC ATTTACGCGG CCGAAGAGCC GGTCACCGTG 
GACCAGATGG CCGCGCTGCT GCGCGACATC GTGCTCGCCG AAATCGCGCA GGAGGCCTCG 
AACGCCGCGG CTGCCGAAGA AACGGCCAAC GGTGAGACCG CGCAGGCAGA TGCTGCGGCC 
GCCGAAGGCA CCACGCCAGA ACCGCACGCC GAATCTGCTC CCGAGACGCC GAGCGAAGTG 
ACCGGTGAAG CCGCGGTCGA GCCGGATGCC GCCACCGAAG TCAGCGCGCC CGAAACAACC 
TCGAAGAAGA AAGCGCCGAA AGATCCCGAG CTGACAGCAG TGAAAGCCAA GCTGCGCACG 
GTGCTCGCTG AGCTCGTTGC CGATTATCAA AGTGACGCGC GCGGCCTTGA AATCCGCCAG 
ATTGCCGGCG GATATCGTAT GGCGACCAAA CCCGAGCATC ACGATGTGGT CGTCGGTTTC 
GCGAAGAGCC TGAAGCCGCC CATTCGCCTT TCGTTGCAGG CGCTGGAAAC ACTGGCGGTC 
GTTGCCTACA AGCAGCCGGT CACCGCGCCG GAAGTCAGCG AGATTCGCGG CGTGGATTCC 
TCCGGCGTCA TCGCCACGCT TCTTGATCGA AAGCTCGTCA CGACCGCCGG ACGCAAACAG 
GTCATCGGCC GACCGATTCT CTACAAGACC ACCAAGGAGT TCCTGCTGCG CTTCGGCCTG 
AAAGACGTCA ACGAGCTGCC CAGCATGGAA GAGTTCGAAA AGCTAGGCGA TGCCGGTCAG 
GGCGTGCTCT TCGAAGCCGA GCAGAAATCA GCAGGACAAA GTGCTTCCGA TGAAGCAGCG 
CGAGCGGACG ACGAAATGAT GGCACGCGAA GAAGACGAGA TCGCATTGCA GGATGATGTG 
GTCGCGCGAG CAGCGGAGGC ATCGGGAGAC GCGAATGCAT CGGAAGATGC GGCATCCGCT 
GCGACTGAAG AAACTAAACA CGAACCCGCC CATGCGGAAG CGAATAGCGA ATCCGCCGCC 
GACACGTCAG AGGTCCAGGG CTCAACGAAT GAGAATGCGT AG

Protein sequence

MSLKGKIEAI IYAAEEPVTV DQMAALLRDI VLAEIAQEAS NAAAAEETAN GETAQADAAA 
AEGTTPEPHA ESAPETPSEV TGEAAVEPDA ATEVSAPETT SKKKAPKDPE LTAVKAKLRT 
VLAELVADYQ SDARGLEIRQ IAGGYRMATK PEHHDVVVGF AKSLKPPIRL SLQALETLAV 
VAYKQPVTAP EVSEIRGVDS SGVIATLLDR KLVTTAGRKQ VIGRPILYKT TKEFLLRFGL 
KDVNELPSME EFEKLGDAGQ GVLFEAEQKS AGQSASDEAA RADDEMMARE EDEIALQDDV 
VARAAEASGD ANASEDAASA ATEETKHEPA HAEANSESAA DTSEVQGSTN ENA