Gene Acid345_3214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3214
Symbol
ID	4070426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3802726
End bp	3803799
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	58%
IMG OID	637985235
Product	TonB-like protein
Protein accession	YP_592289
Protein GI	94970241
COG category
COG ID
TIGRFAM ID	[TIGR01352] TonB family C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0817874
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.797935
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGAAA TATCGCAGCG TTTGCCGTTC AGCCAATTAG AGATCAACGA TACCCGAAAA 
GGTCCGTTTG GCACGAGCTT CATTGTTCAG GCAATTTGTG TGGCGATTTT GTTGAATCTC 
ACAATCGTCG CTCCGAAGGT CCTCGACAAG AAGCAATACG AAACGATTGC GCTCACCGCT 
CCGGTAGAGC AGGCAAAAGT ATCGCCCGCC CCGAAGGTGA AAGTTGCGCA ACCGAAAATC 
AAGGTTGAGC CCACCCCGGT TCAGCCACAG CAAGTGAAGA TCACGCCTCC ACCGATGCCG 
ACGCGAATTC CGCGACCTGC GCCGGTGCAA GAAGCGAAGA TCGACGCACC TCCGGCACCG 
AAGTTCGATT CTCCGCGCGT TGACTTACCG CCCGGACCGA AGCCTGCAAA GCCGATCCAC 
ACAAATAACT TTGGCAGCAC CGGTAGCTCG GCCACTCCGA CGCTTGCGAA TAAGAATGCC 
AATGAAGTGC AGACCGGCGG ATTCGGCGAC CCGAATGGCG TACCAGCCAG CGACAGCCAC 
ACCGGCAAAG TTGCGATCGC GAAACTGGGA TCTTTTGATC TGCCGGAAGG CGCCGGCCAA 
GGCAATGGCA CCGGCGGCGG ACACGGAGCG AAAGGCACCG TCGTCAGCTC CGGATTCGGC 
AACGGCACGG CTGTTCAGGG TGGTGGTGGC CGCGGTACAG GCGGCACAGG TACTGGTAAT 
GGTGGTCGCG TAGTGCAGAC CGCGTTCAAC ACGCCGCAGC CCGCTGAGCC GACTACAACC 
AAGAAGGCCG TTGCGGAAGA CTCCGGTTTT ACACCATTCA CGATTCTCTC GAAACCGAAG 
CCGACCTACA GCGAAGAAGG ACGCAAGCGC CATATCGAAG GCGAAGTTCA ACTCGACGTT 
GTGTTCATGG CGAACGGTCA GATCAAAGTT CTCGGCGTCA CCCGCGGACT TGGCTATGGA 
CTCGATGAAG CCGCCATCCA GGCGGCTCAG AAGATCCAAT TTGTACCAGC CAAGCGCGGC 
GGACAGCCCG TGGATTACCA GGCCAAACTC AGGATTCTAT TCCAGCTTAC GTAG

Protein sequence

MAEISQRLPF SQLEINDTRK GPFGTSFIVQ AICVAILLNL TIVAPKVLDK KQYETIALTA 
PVEQAKVSPA PKVKVAQPKI KVEPTPVQPQ QVKITPPPMP TRIPRPAPVQ EAKIDAPPAP 
KFDSPRVDLP PGPKPAKPIH TNNFGSTGSS ATPTLANKNA NEVQTGGFGD PNGVPASDSH 
TGKVAIAKLG SFDLPEGAGQ GNGTGGGHGA KGTVVSSGFG NGTAVQGGGG RGTGGTGTGN 
GGRVVQTAFN TPQPAEPTTT KKAVAEDSGF TPFTILSKPK PTYSEEGRKR HIEGEVQLDV 
VFMANGQIKV LGVTRGLGYG LDEAAIQAAQ KIQFVPAKRG GQPVDYQAKL RILFQLT