Gene Acid345_2624 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2624
Symbol
ID	4072033
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3094736
End bp	3096367
Gene Length	1632 bp
Protein Length	543 aa
Translation table	11
GC content	61%
IMG OID	637984641
Product	hypothetical protein
Protein accession	YP_591699
Protein GI	94969651
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.672502
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.615822
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAGA CCAAGCCCGC CCCGCCGCCG CTACCGATTG ACTACTCGGG ATTCGTGGCG 
CTGTGGGGCG CGTTATTTTC TTTCGCTGCA TTCCTGTACT TCTACCGCCA CGGCGAGACG 
CTGTTGTACG GCGACGCCGT TGCGCATATC AACATCGCGC GACGGATCTT CGATTGTCGC 
GAGCCGGGAT TGCGCCAGCT CGGAACCGTG TGGCTGCCGT TTCCGCACCT CGTGATGGCG 
CCGTTTTTGC TCAATGACAA CTTCTGGGTA AGCGGCATCG GCGGCTCGCT GCCTTCGATG 
GTGGCGTTCG TGCTGGGTGC AGTCGGGCTC TACCGGCTCG TAGCGGCGCG AACCGCGCAC 
TGGGTCGGCG GAGTGGCGGC GGGGATCTAT TTGCTCAATC CCAACCTGCT GTACATGCAG 
TCGACCGCGA TGGGCGAGAG CATCTACCTC GCGCTGATGA TCTGGGCGGT GTTTTACCTC 
GACGCATTCG CGCGCGGTTT GCGTGACCCG GAGCAACCGC TTCGACCTGC AAAAGCATTG 
ACGCGTTGCG CAATGGTACT CGCGGCAGCG ATCCTCACTC GCTATGACGG TTGGTTCTTC 
ACGTTCATCA TTGCGCTGGC CGCGCTGTTT ATTCTGGTGC GCAACTGGAG CTTGCAGAGC 
GACAAACAAA AGCGTTTGCT GACGCGCTCC GCCATTCACT TCACGCTGCT GTGCACACTC 
ACCCCGGCTT TGTGGATGAG CTACAACTAC TGGCTCTCAC GACATCCGCT GGACTTCGCA 
ACCGGGCCAT ATTCCGCGAA GGCGATTGCC GCGCGCACCA CGCCGCAAGG CGCGCCGCCC 
TATCCCGGCA AAGACCACAT GGCTACCGCG GCGACGTATT TCCTAAAGGC CGCGAAAGCC 
AACATGGCGG AAGGCCGCTG GCAGTTCTGG CTGATGGTGG CTGCGGTGCT CGGGAGCGCA 
ATTGCGGCGG TCGTGGTTCG CGGCGGCTGG CTTTGGCTTT TGCTATGGAC GCCGTTGCCG 
TTTTACGCGC TTTCCATCGC CTACGGCAGT GTGCCTATCT TCGTGCCGGA GTGGTGGCCG 
TTCTCCTACT ACAACGTGCG TTACGGGATG GAACTGATTC CCGTCTTCTG CGTGAGTGTG 
GCGTTCCTCG CGTCGCTAGG GAAGCGCGCG ATGCTGCCGG GACGCTGGCA GATCGCACTG 
CCGGTTGTCG TGCTGGCGAT TGTGGTAGGA GGCTATTACG CGTCGTGGCG CGCGACCCCG 
ATTTGTCTGC GCGAGGCCCA GGCCAATGGC CGCAACCGCA TGTCGGAGGA CGCTGCCGTT 
GCTCGCTACA TCCAGATGAT GCCGCCGGAT ACGACCATCC TGATGCAGAC CGGTTCCTAC 
GTCGGCGCGT TACAGATGGC GGGACGGCAC CTCGACAGCG TGGTTTGGGA AGGGCTCTAT 
TACCAGTGGG AACTAGCCCT CAATCAACCG GCAGAAAAAG CGGACTACAT CATCGCCTTC 
GGTAACGATG AGGTCGCGCA AGCCGTAAAG GCGCATCCGC AAGGCCTGGA AAGCATCGTG 
GTGTTGCGTG TTGGCGATCA GGCCCCGGCC ACGATTTATC GCAGCACCGC TCGAAACGCA 
CGGCCGCTTT AG

Protein sequence

MKKTKPAPPP LPIDYSGFVA LWGALFSFAA FLYFYRHGET LLYGDAVAHI NIARRIFDCR 
EPGLRQLGTV WLPFPHLVMA PFLLNDNFWV SGIGGSLPSM VAFVLGAVGL YRLVAARTAH 
WVGGVAAGIY LLNPNLLYMQ STAMGESIYL ALMIWAVFYL DAFARGLRDP EQPLRPAKAL 
TRCAMVLAAA ILTRYDGWFF TFIIALAALF ILVRNWSLQS DKQKRLLTRS AIHFTLLCTL 
TPALWMSYNY WLSRHPLDFA TGPYSAKAIA ARTTPQGAPP YPGKDHMATA ATYFLKAAKA 
NMAEGRWQFW LMVAAVLGSA IAAVVVRGGW LWLLLWTPLP FYALSIAYGS VPIFVPEWWP 
FSYYNVRYGM ELIPVFCVSV AFLASLGKRA MLPGRWQIAL PVVVLAIVVG GYYASWRATP 
ICLREAQANG RNRMSEDAAV ARYIQMMPPD TTILMQTGSY VGALQMAGRH LDSVVWEGLY 
YQWELALNQP AEKADYIIAF GNDEVAQAVK AHPQGLESIV VLRVGDQAPA TIYRSTARNA 
RPL