Gene Acid345_1625 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1625
Symbol
ID	4072551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	1972105
End bp	1973265
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	58%
IMG OID	637983634
Product	hypothetical protein
Protein accession	YP_590701
Protein GI	94968653
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.451604
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCTCGC GAGAGTGGCT GCGGTGGTGG TGGGTGTGTG CTCTGTTGTG GCTCTGCTCG 
TCGCACCCGG TGACGGCACA GTTCACGACC GAAGACCGTT TGGCGGTGCC AGGGTTCTGG 
CCCACGAAAT GGGCGAACTC GCGTGATGCT TATGTTGGAC CGAAAGTTTG TGCCAGTTGC 
CATCCCAGCA AGCTCGCCGA ACAACAAACG ACTGCCATGG CACAGACGTC TGCGCGCGTA 
GGCGATTCGA TTATTGTTAA GAACCATCCA GAACTTCACT TCGACATCGG AAAGATCCAC 
TACGAAATTC GCAAAGACGC GAACAGGGAT ACGCTTTCCG TGAGCGATGG GCAGCAATCG 
CTCACAACTT CACTACTGTG GGCCTTCGGG AACGGAAGAG TGGGACAGTC CTATCTGTTC 
AAGAAGAAAG ACGGATCGTT CTATGAGGCT CGCGTTTCCT ACTTCGCGAC GCTTAAGAAC 
TTGCACTTCA CACCGTCGCG GGCGCTCGAG AATCCCAAGA ACCTGGACGA AGCGATCGCG 
CGTCCAGTGA CATTCGAAGA GGTGCAAAGA TGTTTCAGTT GTCACAGTAC GGCTGCGATC 
ATCGGCACCA AACTCGACGA GCAAAACCTA ATTCCTGGAG TGAGTTGCGA AGCTTGTCAT 
GGGCCGGGTG CAGAACACGT CGCCGCGGCT CAAGCTGCAG AAATGGCCGG AGCACCGGAA 
GAAGCTCGCG GGGCGATCTT CAATGCGGGT AAGTTGAAGC CCGCGGACGC GGTGGACTAT 
TGCGGCGCTT GCCACTTTTC CTACTGGGAC ATGAAGCTGA GCCACACTTC TGGCGTCTCG 
ACGTCGAAAG CGCAGCCATT CCGCTTGGAG GAAAGCAAGT GCTGGGGAAG CAAAGGCGAT 
GCGCGTCTCA CGTGCACTGC ATGCCACGAT CCTCACCAGC CGCTTGTGGT TGGCGCCGCG 
GCCTACGACC ACAATTGCCT GGAATGTCAC GTGACAACGG GAATGAATCC GACAGGCGAG 
CGCCCGGGCC GTGCTTGCCC GGTGTCTTCG AATCAATGCA CGAGTTGCCA CATGCCGAAG 
CAGCCCGCGC CGACCATGCA TTACGCCTTC ACGGACCACC GCATCCGCAT CGTGAAGCCG 
GGCGAAACAT ATCCAGAGTA G

Protein sequence

MRSREWLRWW WVCALLWLCS SHPVTAQFTT EDRLAVPGFW PTKWANSRDA YVGPKVCASC 
HPSKLAEQQT TAMAQTSARV GDSIIVKNHP ELHFDIGKIH YEIRKDANRD TLSVSDGQQS 
LTTSLLWAFG NGRVGQSYLF KKKDGSFYEA RVSYFATLKN LHFTPSRALE NPKNLDEAIA 
RPVTFEEVQR CFSCHSTAAI IGTKLDEQNL IPGVSCEACH GPGAEHVAAA QAAEMAGAPE 
EARGAIFNAG KLKPADAVDY CGACHFSYWD MKLSHTSGVS TSKAQPFRLE ESKCWGSKGD 
ARLTCTACHD PHQPLVVGAA AYDHNCLECH VTTGMNPTGE RPGRACPVSS NQCTSCHMPK 
QPAPTMHYAF TDHRIRIVKP GETYPE