Gene Acid345_2850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2850
Symbol
ID	4070369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3388579
End bp	3389598
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	59%
IMG OID	637984868
Product	hypothetical protein
Protein accession	YP_591925
Protein GI	94969877
COG category	[S] Function unknown
COG ID	[COG0392] Predicted integral membrane protein
TIGRFAM ID	[TIGR00374] conserved hypothetical protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGCCG CCTCGGACGT AGAGCTATTC CCCGATCGAA ATACTTCTTC CACACGCTCT 
CGTATCATCC TGGTTGCGGC CATCGCACTG GCGGCACTTC TTCTTTACCT ATCGCTGCGA 
AAGCTGGACT GGCGTGAGGT CTGGCGAGCG ATCGCTGCGT GCCGGCTTCC TCTGCTCGGA 
GTAACGCTCG TCATTTCGTT TGGGGCGTAT TTTCTGCGCG GGCTTCGCTG GCGGGTGCTG 
CTCAATACGC AGGCAAAGCT TCCGGTGCTG CGGGTCTTCT GGGCAAATAC TGCCGGCTAT 
CTGGGAAATA ACGTGCTCCC AGCGCGCGCC GGAGAACTCA TTCGCACCGC GATGGTCAGC 
TCGCAGTCAG GGCTCAGCAA AACGTTTGTG TTGACCACCG CACTCGCGGA ACGGCTGATG 
GATGCCATTG TGCTCATCAT CGCCGGCACG GTGGTCTTGC ATGTTGTGCC GAACAAGCCG 
GACTGGCTCG ACCGCGTTTC CACGCCGCTG TTGTTCGTTG CCACTGTGGC GGGCTTGGCG 
CTGCTGCTGA TGCCGCTCTT TGAACAAACC GCCAGGAAAT TGGCCGCGAA GCTTCCGTTC 
TCCGAGAAGC TAAGGCAACG GCTGGCGGGA ATGATCGAGC ACATCGCTGA CGGCGTTCGC 
TCGTTCCACG ACCCAGTGAG CTTTCTTCAA TTCGCACTGC TTACATTTGG CATCTGGTCG 
CTCGATGCCT ACGCCACCGT CATTCTCGCC AAAGCGATGG GGCTCCAGAT GTCGATCCTG 
GTCGCGCTTT TGTTGATCGT CGGACTGGCG ATGGGGAGCG CGCTTCCCTC CACTCCGGGA 
TATATCGGCA TCTACCAATT CGTTGCGGTA ACGGTGCTCA CGCCGTTTCA CTTCACCCGC 
GAGCAGGCCA TCGCATTCAT CCTGATCGCG CAGGCGAATG GACTCGTCGT CACGGCCATT 
CTGGGCAGCA TTGGATTGTT GCAGTATCGC CGGATGGGAA AGCCCAGACT AAATAGCTAG

Protein sequence

MTAASDVELF PDRNTSSTRS RIILVAAIAL AALLLYLSLR KLDWREVWRA IAACRLPLLG 
VTLVISFGAY FLRGLRWRVL LNTQAKLPVL RVFWANTAGY LGNNVLPARA GELIRTAMVS 
SQSGLSKTFV LTTALAERLM DAIVLIIAGT VVLHVVPNKP DWLDRVSTPL LFVATVAGLA 
LLLMPLFEQT ARKLAAKLPF SEKLRQRLAG MIEHIADGVR SFHDPVSFLQ FALLTFGIWS 
LDAYATVILA KAMGLQMSIL VALLLIVGLA MGSALPSTPG YIGIYQFVAV TVLTPFHFTR 
EQAIAFILIA QANGLVVTAI LGSIGLLQYR RMGKPRLNS