Gene Acid345_4093 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4093
Symbol
ID	4072515
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4852941
End bp	4854425
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	62%
IMG OID	637986124
Product	integrin-like protein
Protein accession	YP_593167
Protein GI	94971119
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.588322
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTATCA TCACTCGTCT GCTGACACTC GTCTGCAGCA CAGCGTTGAC CGTTGCTGCC 
GGGGCGCAAG CCGCCAATAG TTACAACGGA ACATCGCCGA TCACCTACAA CTACACCACC 
CTGACCACGT CCGGCGCCCA GGGTTACTCG GTCGCCTCGT CCGACTTCAA CCGCGACGGC 
AACCCTGACC TTGTCGGCGG CACCGAGAAC GCCGTGGACG TATGGCTCGC CACCGGCCGT 
GGCACCTACG TGAATTCACC TGTGTCCTAC GCGCTGCCGT TTTCGCCTAC GCACATCGAA 
ACGCCCGACT TGAACAACGA CGGCTGGCCG GACATCGTGA CCGCGATTGC CAATGAAGCC 
GGCGTAACTG ATGGCGAAAC CGCGGTGTTG CTAAACAACG GCAACGGCAC CTTTCGCATG 
GGGACGACGA TTCCGAAGGT CACCGGCCAG CCCATCTGGG TATCAGCCGG CGATCTCAAT 
AACGACGGCA ACATCGACCT GGTAGTGGAA GAGCGCATGT TCAATAACGG CGTCCAAACC 
GACCAGTTCA TTGTGTACAT GGGCCACGGG AACGGCACCT TCACCAAGGG CCAGGTACTG 
AACATGTCAA AGCCCACTAG CCCGCCCGTG CTCGCCGACC TGAACGGTGA CGGCAAACTC 
GACATCGTGA ATGCCGAGGG CACCAAGGCG CTGATCTGGC CGGGCAAGGG CGACGGCACC 
TTCGGAACGC CGATGAGCCT CCTCCCTCCG AGCGGCGCGG CTTTCAATGA CGTGACCACC 
GGCGACTTCA ACAACGATGG CATTCTCGAC CTGGCGCTGG TGTGGTCCAA CGTCTGCGGT 
GACGCCTGCG GCGGGCCGAA TAACAACCGT CTGTACATTT ACAAGAACAA CGGCAAGGCC 
CAGTTTACGC TGGTCTCCGG GACCAACTTT GGCGGATGCA GCGCCGCCTA CCCGGTCGCG 
GCTGACATCA ACGGCGATGG CAACATCGAC ATCAACCTCG TGGGGCCCAG CCATTTCTGC 
GGCTTTTCCG AGGTGGCGTT CGGCAATGGC AAGGGGGGCT TCAGCGCGCT GATGAGCGGG 
CCTTCCGGTG ACGTAACCTC GGATATGTTC TACCGCGATC TCAACCTCGA CTCTCGGCAC 
GACGTAGCGC TCAGTGACAC CATCGGCGGT GATGTTGTAT CAGGCTTGGC GACCAATGGC 
TACACCAACT GCGCGCCGCC GACAGCGGCG AACCCTGCGG CGAAGATCTG CTCGCCAACC 
GGCAGCTCGT GGCCGGGCAC GTTTACCCTG CGCGCCAGCG GCAATTCACC GTCGGGGATC 
GTGCGCATGG AGGTGTGGAT CGACGGCGTG AAGAAGTACC AGAAGTGGAA CGACCAGCTC 
GGGAAAAGCT TCACGCTTTC CGCCGGACAG CACCGCATTA CCGTAGTCGC GGTGGACAAG 
TACAAGGGCG ACGGCCGCAC CACGGCGATC GTCAACGTGC AGTAG

Protein sequence

MRIITRLLTL VCSTALTVAA GAQAANSYNG TSPITYNYTT LTTSGAQGYS VASSDFNRDG 
NPDLVGGTEN AVDVWLATGR GTYVNSPVSY ALPFSPTHIE TPDLNNDGWP DIVTAIANEA 
GVTDGETAVL LNNGNGTFRM GTTIPKVTGQ PIWVSAGDLN NDGNIDLVVE ERMFNNGVQT 
DQFIVYMGHG NGTFTKGQVL NMSKPTSPPV LADLNGDGKL DIVNAEGTKA LIWPGKGDGT 
FGTPMSLLPP SGAAFNDVTT GDFNNDGILD LALVWSNVCG DACGGPNNNR LYIYKNNGKA 
QFTLVSGTNF GGCSAAYPVA ADINGDGNID INLVGPSHFC GFSEVAFGNG KGGFSALMSG 
PSGDVTSDMF YRDLNLDSRH DVALSDTIGG DVVSGLATNG YTNCAPPTAA NPAAKICSPT 
GSSWPGTFTL RASGNSPSGI VRMEVWIDGV KKYQKWNDQL GKSFTLSAGQ HRITVVAVDK 
YKGDGRTTAI VNVQ