Gene Acid345_1111 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1111
Symbol
ID	4069226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1386320
End bp	1387774
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	58%
IMG OID	637983120
Product	hypothetical protein
Protein accession	YP_590188
Protein GI	94968140
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.255858
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000181601
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGAAGA GTTCCCGCTC CCTGGTTGTG GTTTTCATGT TGTTTGTTTT AGTCCTGCTT 
GCCGGATGCG GTACATCGTC GTCTCCCGAT CCGGCCCCCA CTCCACTGAG CGCAAAGAAC 
GTAAATCTTA TTTTCGTGGC CAGTGAAGAC CTGCAACATC ACGGCACGCA GGACATCAAC 
GACGACACCG CAAATCTCAC CAGTCAAGGG TTACAGCGGA CACTGCTCCT TGGGACCTAT 
CTAAAGCAGA ATGTGCTCGG CGGGAAAGCG GTCACCGCGA TCTACGCCCT GGAGCCGATG 
ACCCATCTTC AAACTACGAA CAAGTATCCC GACATGGCGC CGTTGATGGC CGTCCAACAG 
TTCGCCATGC TCAACCAGGT CAGCACTTCG ATTAACGGCG GAGCGCCGGT CACTGGGAAC 
AGCTTTCCGA TCTTCGCTTC ATACGCTGAC AGCGCAGCAT TACCGAACGA TGTCGCACAG 
CCCGTCTTCT CGTGCCCAGG TTGCCAAGGT CTGGACTTCA CCGACCAGAA CGGCGCCAAC 
GAGGCACTCG TCGAAGCGCT GATCACGGCC AAGAGCCCCG GATACTTTGT CTTTTCCGCG 
CCTTGGGACA CGGTCAGCGC GATGATGTCG AACATCAATG CATCGGAAGG TTTCGGACTT 
GCCCTGCCAT CGAGTTATGG CGGCCCCGAC CACGTGTATG CGATCTCAAT TGCGCCTTCA 
GGAACCGCGG CCCTTGTCGG TTACAACGCC GACCTTCATC CGGGAACAAG TTACCCCGCA 
TTGCCGGCAG GCAAAATCGC GAGCGCACGC TGCCAGGGGA CATACAGCGT AAGTGCCGTG 
GGCGGCGCCG GCGGCGCGGT GGTTCCTGCG AACACCAACG TGAATGAAAC GGTGTACATG 
ATTCGCCACG CCGAGGCGCA TCCTGCAGCC AACTGGGATG ACGGCAACTA CGTGGCTGCG 
GGACAATGGC GCGCGCTCGA CTTGCCGAAC GCGCTGGCCG GAAAGATCCA CCCGGACCAG 
GTAATCGCCA TCGATCCTGC AATCGGCATA CCTGGCACGC CCGAGAGCAT CACGTCCTCC 
TACATTCGCC CTGCGATGAC GGTAGAGCCA TATGCCATCG CGAACAATCT GCCCTACAAC 
CTGGCATCGA GCGTTGCAGT GTTTTCGCAA AACGCGCCGC AATTGGCAAC GAAGGCAAGC 
AACTATCTCT TCACCAATGG AACGTTTTCG AACCATGTCT TGCTCGTCGC GTGGGAGCAC 
AAGCACGTTC CGCCGACGAT CAATGCTTTG CTGTACTCGT ACGGAGTGGC ACAAAACGCG 
CCCTTGTGGA ATGACGAAGA CTACGATTCC ATCTGGACTG TTCGGTTGGA TGCGCAGGGA 
AATCTGAGCA TCGATAACCT GGCTTGCGAG GGCATCGATT CCACTTCCCT GCCAGCGACA 
GCGCCGCAAT TCTAG

Protein sequence

MTKSSRSLVV VFMLFVLVLL AGCGTSSSPD PAPTPLSAKN VNLIFVASED LQHHGTQDIN 
DDTANLTSQG LQRTLLLGTY LKQNVLGGKA VTAIYALEPM THLQTTNKYP DMAPLMAVQQ 
FAMLNQVSTS INGGAPVTGN SFPIFASYAD SAALPNDVAQ PVFSCPGCQG LDFTDQNGAN 
EALVEALITA KSPGYFVFSA PWDTVSAMMS NINASEGFGL ALPSSYGGPD HVYAISIAPS 
GTAALVGYNA DLHPGTSYPA LPAGKIASAR CQGTYSVSAV GGAGGAVVPA NTNVNETVYM 
IRHAEAHPAA NWDDGNYVAA GQWRALDLPN ALAGKIHPDQ VIAIDPAIGI PGTPESITSS 
YIRPAMTVEP YAIANNLPYN LASSVAVFSQ NAPQLATKAS NYLFTNGTFS NHVLLVAWEH 
KHVPPTINAL LYSYGVAQNA PLWNDEDYDS IWTVRLDAQG NLSIDNLACE GIDSTSLPAT 
APQF