Gene Acid345_2062 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2062
Symbol
ID	4070604
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2472620
End bp	2473756
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	54%
IMG OID	637984076
Product	hypothetical protein
Protein accession	YP_591137
Protein GI	94969089
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0964695
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.390374
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAGAA TACCAGGCAC CCCGCTCGAA ACTCTCGAAC TGCCTGAAGA TCCGCCCAAA 
CAGACAGACC CGTGCTGGTG CCGGTCAGGC ATCGAATTTG GAAAATGCCA TTTCGAACGG 
CATCTACAAC CGCGAGAATC CCCCTGGAGT GCTCTCAAAG AAGCGTCCAG GCTGAATGAC 
GCGAAATACT GTGGGCATCC ACTGGCCTCA CCGGTCACAT GCAGCGGCAA AATCGTTCGC 
GCGCACACGG TTCAACTGGA AGGTGCCTTG AGCACCATCG CCGTCGATCG CCACGTTTAT 
GGGCTTGCAA TGAAGGACGG AAGGTTGGAG TACGGACTCA TCGGTCTACG AAAGGCGTCA 
ACGTTTTCGG GGTTTTGCTC TTATCACGAT GCCGAGCTCT TTCGCGCGCT GGAAACGAAA 
CCCTTCACCG CAACTAAAGA ACAGTTGTTT CTGCTCGCCT ATCGCGCACT TTCAAAAGAG 
GTCTACGCGA AGCGATACGC TATCCGCACC ATTCCCCTTC AACGCAGGCA GGACAAGGGC 
TCCGACGCCT TGCACCAGGT GAACGTTCAG AGTTACCTCT ACCTCCGGGA GCAAGCGTTG 
AGGCTCGGAT TGCGCGATCT GGAGTCCGCA ATAGCAGATT ATGACAAAGC TCTCTTGGCA 
AGGGACCATG ACCGGTTTTC TGGTTATTTG GTATTTACCG ACAAAACCCC GGATCTCGCG 
GTCAGTGCAG CGATGTTTCC GGAGTTCGAC TTTCAGGCAA ACGCGCTCCA ATCGCTGTCT 
AGTGCTGAAT GTCTTGACCT CCTGACCTAC ACAGTGTTGC CAATGTCGTC TGGGGGTGTC 
ATCGCTTTTG TGTGGGATTC GAAAAGCGCC AGGTCGTGCG AAAAGCTCGT TGCTAGCCTT 
GATCGCCTCC CTATGCGAGA GCTGCCGGAT GCACTGATTC GATTCACCTA CGAGTACTTC 
GAAAATTGCT TTGCGAATCC TCTTTGGTGG GATTCGCTTT CCGGGGTGCA GAGAGAACGC 
TTGCTCGCGA GGATTAATCT AGCGGTCTCT CCGACAGATG ACCGTACACC AGACTGTCTG 
AAAGATGACG GACTGCGGAC GGCAAGGTGG AACGTAATTG CCAAGGAGTG GTTTTAG

Protein sequence

MARIPGTPLE TLELPEDPPK QTDPCWCRSG IEFGKCHFER HLQPRESPWS ALKEASRLND 
AKYCGHPLAS PVTCSGKIVR AHTVQLEGAL STIAVDRHVY GLAMKDGRLE YGLIGLRKAS 
TFSGFCSYHD AELFRALETK PFTATKEQLF LLAYRALSKE VYAKRYAIRT IPLQRRQDKG 
SDALHQVNVQ SYLYLREQAL RLGLRDLESA IADYDKALLA RDHDRFSGYL VFTDKTPDLA 
VSAAMFPEFD FQANALQSLS SAECLDLLTY TVLPMSSGGV IAFVWDSKSA RSCEKLVASL 
DRLPMRELPD ALIRFTYEYF ENCFANPLWW DSLSGVQRER LLARINLAVS PTDDRTPDCL 
KDDGLRTARW NVIAKEWF