Gene Acid345_4150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4150
Symbol
ID	4072341
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4909720
End bp	4910865
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	62%
IMG OID	637986181
Product	hypothetical protein
Protein accession	YP_593224
Protein GI	94971176
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.280981
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACAA CTCCCAGCAC TCCTGGCGAC CCGAAGAATG CGCATTTTCC CTGCCCCGGC 
TGTTCGGCGG ACATGAAGTT CGACCCCGCG TCGGGGATGA TGAAGTGTCC GTTCTGCGGA 
ACCACCTCGG CGGTGCCGGC ATTGAAGCAA ACGACATCGG CGGTAGCGTC GCCATCACCG 
GGGCACCTGG ATTGCCATCC GCTGGAAGAG TTCCTGGCGA AGGCGCACGA CGGGCAGCTG 
ACGCAGCTCG CGCCACAGGC GCTGGAAGTG CATTGCGCGG CCTGCGGCAG TTCGGTGACG 
TTCCAGCCGC CGGAGGTGGC AGGGGTTTGT CCGTTCTGCG GATCGGCAAT TGTGGCACAG 
GCGAAGGCCG CGGACCCGCT GCTGGCACCG GATGGCGTGC TTCCGGCAAA GATCGTGAAG 
CAGCAGGCGC AGGGCGAGGT GAAGCAGTGG CTGAGCTCGC GCTGGTTCGC GCCCAACGCG 
CTGAAGACGA TGGCGCGGCA GGAAGGCATC AACGGCGTGT ACCTGCCGTT CTGGAGCTAC 
GACGCGGACA CCGCCAGCAA TTACACCGGA GAGCGAGGCA TCAACCGCAC CGAGACGGAG 
AGCTATACCG ACAGTTCAGG CAACCGGCAG ACCCGGTCGC GCACTGTGAC GGACTGGTGG 
CCGTGCTCCG GTCATGTGAA CGTGAATTTC CATGACGTGC TGATCGCCGC GTCGCGCTCG 
GTGCAGGAAA AGAAGCTGGA TGCGCTCGAA CCGTGGGGGC TGGAAGCGTT ACAGGCCTTC 
GAACCCGCGT ATTTAGCGGG CTTCAAGGCG CAACGCTACC AGGTGCAATT GGCAGACGGC 
TACACCGAGG CGAAACAGGT GATGGCCAAC GGGATCGAGC AGGCGATCCG GCGGGACATT 
GGCGGCGATG AGCAGCGGAT TTCGTCGGTG GACTCGACGT ACTCGAATGT CGGGTTCCGA 
CATTTGTTGC TGCCGGTGTG GATTGGGGCT TATCGCTTCC AGAACAAGGT GTACCAGGTG 
GTGGTGAATG CGGCGACGGG CGAGGTGCAG GGAGATCGGC CGTACAGCGC GGTGAAGATT 
GCGATGTTGG TGATCTTTAT CATTTTCGTG ATTTTGATTT TAGCGATGAT TGGGGGAAAG 
CACTGA

Protein sequence

MATTPSTPGD PKNAHFPCPG CSADMKFDPA SGMMKCPFCG TTSAVPALKQ TTSAVASPSP 
GHLDCHPLEE FLAKAHDGQL TQLAPQALEV HCAACGSSVT FQPPEVAGVC PFCGSAIVAQ 
AKAADPLLAP DGVLPAKIVK QQAQGEVKQW LSSRWFAPNA LKTMARQEGI NGVYLPFWSY 
DADTASNYTG ERGINRTETE SYTDSSGNRQ TRSRTVTDWW PCSGHVNVNF HDVLIAASRS 
VQEKKLDALE PWGLEALQAF EPAYLAGFKA QRYQVQLADG YTEAKQVMAN GIEQAIRRDI 
GGDEQRISSV DSTYSNVGFR HLLLPVWIGA YRFQNKVYQV VVNAATGEVQ GDRPYSAVKI 
AMLVIFIIFV ILILAMIGGK H