Gene Acid345_2999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2999
Symbol
ID	4071554
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3551813
End bp	3553009
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	58%
IMG OID	637985018
Product	hypothetical protein
Protein accession	YP_592074
Protein GI	94970026
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00101465
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAGCGACA CGCACGTGAG AGAGTTCGAT TACACCGTTC CTGCCGCCGC TGCCGGTTGG 
CAAAGGAACT CGGTCATCAT CGGCGTCATC GGCGCGATTG CGCTTGCAGT GATCGGCGTG 
TTTTGGCACC AGGCCTTCAT GCGCGGCTAT CTCGTCGGTT TCATGCTCTG GCTGGGCCTC 
AGCCTCGGCT GCATGGCTCT GCTGATGCTG CAGTACGTCA CTGGCGGACT TTGGGGCTTG 
GTTTCGCGCC GCTTCCTCGA GGCTGCCGCA AAAGGCTTCC CGTTGATGGC GATCATCTTT 
ATCCCATTCG CCATTGCCGC ACCCAGCTTC TATCCGTGGG TTGATCACCA GACCTGGTGG 
CTGAATTTCC CCTGGTTCTA CATTCGCGCC GCCATCTACT TCGTCATCTG GACGGCCCTC 
TCTTACACCG TCAGCGGATG GGGCCGTCGC TACGATGAAG GTCCAGCGCC ATCGCTCTCC 
GGAAAGCTGC AGGCGATCTC CGCACCGGGC CTGATCCTCT ACGTCTTCAC CATCACCTTC 
GCGGCGGTGG ATTGGGTCAT GTCCCTTACG CACGGTTGGG TATCCACCAT CTATGGTCTG 
CTCTATCTCG CTGGCCAGGG TCTCTCGGCC TTAGCCTTCG TGATTATCAT GCTGTGGCTG 
GTGAGCAAGT ACGAGCCCTA TCGCACGATC GTCACCCGCA CCCAGGTTCA CGACATCGGT 
AAGCTGATGA TGGCCTTTAC GCTGTTGTGG GCATACTTTT CCTACTCGCA GTTCCTCATC 
ACCTGGTCCG CGAACCTGCC GGAAGAAATC CAGTGGTACC TGCATCGCAT CCGCGGGGCT 
TGGGCGCCGG TCGCGATCTT CATCGTCATG TTCCACTTCT TCGTTCCGTT CGGCATCATG 
CTGTCGCAAG AGTTCAAGCG AAGCCTGAAC AGGCTTTGGA TGCTAGCGGT GTTCATGATC 
TTTATGCGAG TGGTGGACCT TTTCTGGTAC ATCGCGCCGA ACTTCGACGC ACCGCATCCG 
GAGCAAGCGG GTGCATTCCC GGAACTCCAG GTTCTCCTTG CCGTCGCCGC GTCAGTCATA 
GGTATCGGCG GACTCTGGCT TGCGTTCTTC TTCTTTAACT TGCGCAAGGC GCCGCTAGCC 
CCGGCGTACG ACCCGCAAAT GCCGCTGTTG TTGAGCATGA GCGAACATGG ACACTAA

Protein sequence

MSDTHVREFD YTVPAAAAGW QRNSVIIGVI GAIALAVIGV FWHQAFMRGY LVGFMLWLGL 
SLGCMALLML QYVTGGLWGL VSRRFLEAAA KGFPLMAIIF IPFAIAAPSF YPWVDHQTWW 
LNFPWFYIRA AIYFVIWTAL SYTVSGWGRR YDEGPAPSLS GKLQAISAPG LILYVFTITF 
AAVDWVMSLT HGWVSTIYGL LYLAGQGLSA LAFVIIMLWL VSKYEPYRTI VTRTQVHDIG 
KLMMAFTLLW AYFSYSQFLI TWSANLPEEI QWYLHRIRGA WAPVAIFIVM FHFFVPFGIM 
LSQEFKRSLN RLWMLAVFMI FMRVVDLFWY IAPNFDAPHP EQAGAFPELQ VLLAVAASVI 
GIGGLWLAFF FFNLRKAPLA PAYDPQMPLL LSMSEHGH