Gene Acid345_1726 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1726
Symbol
ID	4072071
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2092821
End bp	2094047
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	57%
IMG OID	637983734
Product	hypothetical protein
Protein accession	YP_590801
Protein GI	94968753
COG category	[S] Function unknown
COG ID	[COG3503] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGCC GTCCATTTTT ATCTCTCAAT CAAGCGACTT CGGCCCGATC GAAGCGCCTC 
CAATCGGTGG ACATTCTTCG CGGCGCCATC ATGATGCTGA TGGCCATCGA CCACATTCGC 
GATTTCGTCC ATCGCGGCGC GATGCAGTTC TCCCCCACCG ACCTTACCCG CACCACCGCG 
CCGATCTTCC TCACCCGCTG GATCACCCAC TTCTGCGCCC CGGTCTTTTT TCTTACCGCC 
GGCATCGGCG CATTTCTCTG GATGTCGCGC GGCAATCACA CCAAGCGCGA ACTCTCATGG 
TTCCTCCTGA CCCGCGGCCT CTGGCTCATT CTTATCGAAA ATACGATCCT GCGCGTCGTG 
ATGTTCTCGC AGGTGAGCTA CCGTGGATCC GTCATCATTC TGCTTATCCT CTGGGGACTC 
GGCGCATCGA TGATCGCTCT CGCTGCACTC GCGCATCTCC CAATCCGCGT TCTCGCGCCG 
CTGAGTCTTC TCGTGATCGT GATCCACAAC GCCTTCGACC CGCTGACCGC CGATAAGTTC 
GGCCGCTTTG CATGGCTCTG GGACATCCTC CATCAGCAAG GCCTCTTCAC GGTCGCAGGA 
TTCAACTTCG TCACCGCCTA TCCGATAGTT CCGTGGATCT TCGTCATGTC CGCCGGCTTC 
TGTCTCGGCA CCGTGTTCCT TTGGGATCTC GCGCGTCGTC AAAGTTTCCT GCTGCGCCTT 
GGCCTGACCA TGACCGCTGC TTTCTTCGTC GTGCGTGGCA TCAACATCTA CGGCGATCCT 
TCTCGCTGGA TCCATCAGTC CACCGCAACC CTCACCGTGC TTTCCTTCCT CAACGTCACT 
AAATACCCGC CGTCGCTCGA ATTCTTATTG ATGACGCTCG GCCCCGCGTT CATCGTCCTT 
TCGCGTCTCG AAAACATGGG CCTTTCCGAA GCCAACCCTT TCGTGGTCTT CGGACGCGTT 
CCGTTCTTCT ATTACGCTAC GCATCTCTTC GTCATTCACC TCGGCAGCAT CTTGATGAAT 
TTCGTCTACT ATCGCCACAC TTCATTCCTC CTGCTTCCCG CACCTTCTAT GGGCGGTGAC 
CCCAAACTCT TTCCTCCCGA CTTCGGATTT CCTCTTTGGG TTGTCTACGC CTTCTGGCTC 
GCGACGCTTG CCGCCCTGTA TCCAGCCTGC CTCTGGTTCT CGCGACTCAA AAAACGACGC 
CGTGATTGGT GGTTGAGTTA TCTCTGA

Protein sequence

MSSRPFLSLN QATSARSKRL QSVDILRGAI MMLMAIDHIR DFVHRGAMQF SPTDLTRTTA 
PIFLTRWITH FCAPVFFLTA GIGAFLWMSR GNHTKRELSW FLLTRGLWLI LIENTILRVV 
MFSQVSYRGS VIILLILWGL GASMIALAAL AHLPIRVLAP LSLLVIVIHN AFDPLTADKF 
GRFAWLWDIL HQQGLFTVAG FNFVTAYPIV PWIFVMSAGF CLGTVFLWDL ARRQSFLLRL 
GLTMTAAFFV VRGINIYGDP SRWIHQSTAT LTVLSFLNVT KYPPSLEFLL MTLGPAFIVL 
SRLENMGLSE ANPFVVFGRV PFFYYATHLF VIHLGSILMN FVYYRHTSFL LLPAPSMGGD 
PKLFPPDFGF PLWVVYAFWL ATLAALYPAC LWFSRLKKRR RDWWLSYL