Gene Acid345_1040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1040
Symbol
ID	4073127
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1306586
End bp	1307599
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	58%
IMG OID	637983047
Product	peptidase dimerisation
Protein accession	YP_590117
Protein GI	94968069
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.108705
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTTTG ACGTCGTCGC CCTCACCCGA AAACTAATTG ACGTGGAATC AATTACCGGG 
AACGAAGCAC CGGTGGGTGA GCTCCTGGTT CGCGAACTAT CGGCACTCGG CTACCAAGTC 
TCGCGAATGC CGGTCGAAGA AGAACGTTTT AACGTCTGGG CAACCTCTCC CGGTCACCAA 
CGTCCTAAGG TCGTCTTTTC GACGCACATG GACGTGGTTC CTCCATGGAT TCCCTCGTCC 
GAGGACGAGA AGAACATCTA CGGCCGCGGA GCTTGCGATG CCAAGGGCAT CATCGCCGCG 
CAAATCGACG CCGCTGAGAA GTTGCGCACC AAAGGCATTC ACGCCGGACT ACTGTTCGTC 
GTCGGCGAAG AACGCGACAG CACCGGCGCC TACGTCGCCA ATTCACACGC GCCGGGTTCG 
AAGTTCCTCA TCAACGGCGA GCCCACCGAC AATCGCATCG GTGTCGCCTC TAAAGGCGCG 
CTGCGTGTGA ACGTAATTGC GGAAGGAAAA ATGGCGCACT CGGCCTATCC GGAGCTTGGA 
GAATCCGCGA TCGAAAAGTT GCTGAATGCG CTTGAACGCC TACGCAAAAT GCCGCTTCCA 
GAAAACCCTG AGGTCGGTCC ATGCACGGTA AACATCGGCG TGATCGAAGG CGGCCGCGCA 
CCAAATGTCA TTCCCGACCA AGCCAGCGCC CAGCTGCTCT TTCGCCTGGT CGGCCCGTCT 
GAACAACTGC GTAAAGACAT CGAAACCGCT ATCGCCCCCG ATGCCCACTG CGAATACGCG 
CTTGAGATTC CTTTTGTGAA ACTGCGCACA GTTCCCGACA TTCCGACCAT GACGGCAAAG 
TTCACCACTG ACATCCCGCG CTTGAGCAAC TGGGGCGAGC CCGTTCTGCT CGGCCCCGGC 
TCGATCCATG TCGCACATAC TCCACGCGAG TTCCTGAGCA AGCAGGAACT GTTTGAGGCC 
GTGGAGCTCT ATGTGAAAGT CGCCGAATTT TTCAACGCGC AACCTGGCGC GTAA

Protein sequence

MSFDVVALTR KLIDVESITG NEAPVGELLV RELSALGYQV SRMPVEEERF NVWATSPGHQ 
RPKVVFSTHM DVVPPWIPSS EDEKNIYGRG ACDAKGIIAA QIDAAEKLRT KGIHAGLLFV 
VGEERDSTGA YVANSHAPGS KFLINGEPTD NRIGVASKGA LRVNVIAEGK MAHSAYPELG 
ESAIEKLLNA LERLRKMPLP ENPEVGPCTV NIGVIEGGRA PNVIPDQASA QLLFRLVGPS 
EQLRKDIETA IAPDAHCEYA LEIPFVKLRT VPDIPTMTAK FTTDIPRLSN WGEPVLLGPG 
SIHVAHTPRE FLSKQELFEA VELYVKVAEF FNAQPGA