Gene Veis_4145 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_4145
Symbol
ID	4690528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	+
Start bp	4560067
End bp	4562337
Gene Length	2271 bp
Protein Length	756 aa
Translation table	11
GC content	66%
IMG OID	639851892
Product	hypothetical protein
Protein accession	YP_998868
Protein GI	121611061
COG category
COG ID
TIGRFAM ID	[TIGR02059] cyanobacterial long protein repeat

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.686732
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCTCCA CCATCACCAT CGACAAGACC ATCGTCAGAG CCGGCGAGAC CGCCTTGGTC 
ACCTTTACTT TCTACAATAA GGAGGACATG CTCGTCGTTC GGGGGCAGAT TCATAACGTA 
ACCGTCACCG GCGGCACGAT GAACGCCGGT TCCCTCTCAG GGATGAATCG GACTGCAACC 
ACCAGATTCT TCACAGCCCA ATTCATACCG ACCCCGGGCC TGGAGAAATC CGACGCCAAA 
ATCCGCTACG ACGGCACCGG CGATGTCGCC GATGGAGAGG TCACCTTCGC CGTCGACACC 
CTGCGGCCCA CCGTTGCCAG TGCCTCGATC GCCAAAAGCG ACCTGCGCCT CGGGGAAAAA 
ACCACCATCA CCATCACCTT CAGCGAACTG GTGACCCGCA GCAGCTTCAC CATCGATGAC 
CTGCAGATAG ACGCCGGCAA GGGCACTTTG AGCAACCTGC GCGTCGCCCC CACCGACACC 
ACGGCCACCA CCACTGCCGC CACCACCTGG CTGGTCGACC TGGAGGCCCC GACCACCCGG 
CCCGCGACGG GCCTCGATGG CAACCAGATA CGGATCAACC TCGACGGCAT CACCGATGTC 
CCGGGCAACG CAGGCGCGGG CCGGGGGGTG AGCGTCCCGG CCCGCTACAA CATCGACGAC 
GGTGTGCCGC CCACGGTCAC CATCGCGCCG GCAACCACCA TCCTGCGGGC CGGCGAGACG 
ATGAGCGTCA CCTTCACCTT CAGCGAGAAG GTCACCGGCT TTGGTACCGA GGACATCCAG 
TACGACACCA GCAAAGGCAC GCTGGGCGCT CTGACGGCGG TCGGCACCGA CGGCAAGGTC 
TGGAACGCCA CCTACACCCC CCAGCCCGGC ACCGAGAGCG CCAACAACAC CATCCGCGTG 
AACCTCAGCG GCGTCCGGGA CGCGCAGGAC AACGCCGGCG TGGGCACCGG CACCAGCGGC 
AACTTCGGCA TCGACACCGT GCGCCCCACG GTCAACGTGA CGATCAGCGA CGCCCGCCTG 
ACCGCTGGCG AAAGCGCCAC CATCACCTTC ACCTTCAGCG AGCGCGTCAC CGGCTTCGCG 
AAAAATGCCA TCGATCTGTC CCAGGCCAAC GGCACGCTCG GCGACCTGAC GCCGGTCGGC 
ACCGACGGCA CAACCTGGAC CGCCACCTTC ACCCCCACGG CCAGACTGGC GCGCACCACC 
AACAACCGGC TCACCCTGAA CCTGTACAAC GTGCGCGATG CCGCAGGCAA CGCCCCGGCG 
GCGAACACCT ACGCGTTCAA CCAGTACACC GTAGACACCA TGGTCTTTGT GCTCAGCAAC 
GCCACGGTGA ATCGCGAGCA GTTGGTGCTG AGCTACAGCG ACGAAACGAT GCTCGACGGG 
AACGCGGACC GTGCCCCGAC CAACGAGTCC TTTACCGTGC TGGTCGATGG CACGCGCATC 
GATGTCAGCC GGGTGACGGT GGATGCAGCG GCCAGGACGG TGACGCTGAC CCTGGCCAGC 
GCCGTGACCA CCGGCCAGAC GGTGACCGTC GCCTACCAGG ACACCGACAC CAGCGATAAC 
AAGGCGGTAC AGGAAGCCGG CACCGGCGAC GACGCGACCA GTTTTGCGGC CAGGGCGGTG 
ACCAACCTCA CCCGGCCCCC GGTCGCACCC GCCACACCGG AGGCGCCGGA TGCGCCGGAC 
TCCGACCGCG ACGGCCTGTC CAACAACCGG GAGGACCAGG CCCCCGGCCT GCTGCGCCCC 
GACGGCTCGG CCGGTATGGC TGGTGATGGC AACGGCGATG GCGTCAAAGA CAGCCAGCAG 
GCCGCCGTCG CTTCGACCCG CGACCAGACC CTGGTGGCCG GCAGCCAGAA CGGCAAATTG 
ATCCCCGACA GCAACGCGCG CATCACCGAA CTGGTGCGCA GCGATGCCCC GGCCAACCTG 
CCCAAGGGCA TGGAGATGCC GATCGGCCTG ACCTCATTCA AGGTATCGCT GGCCGAGGGC 
CGCAGCACCG AGAGCTTCAG CCTGTACGTA GATCAGGCGC TCGGCGCCAA CGGCTACTGG 
CTCAAGAACG GCGCCGGCAC CTGGGTGAAC CTGGCCAGCG AACCGTATGG TGGCAAGGTG 
GCCAGCGAAG GCGGGCGCAT GCGGCTGGAC TTTCAGATCC AGGACGGCGG CCAGTACGAT 
GCCGACGGAC TGGTCAACGG CAGCATCAGC GCGCCCGGCG CCGTGGCGAA GATGCCGCTG 
TCCATCGTCG GGCAGTCGGC CCAGGTCGAT TCGCATGGCT TTTGGTACTG A

Protein sequence

MASTITIDKT IVRAGETALV TFTFYNKEDM LVVRGQIHNV TVTGGTMNAG SLSGMNRTAT 
TRFFTAQFIP TPGLEKSDAK IRYDGTGDVA DGEVTFAVDT LRPTVASASI AKSDLRLGEK 
TTITITFSEL VTRSSFTIDD LQIDAGKGTL SNLRVAPTDT TATTTAATTW LVDLEAPTTR 
PATGLDGNQI RINLDGITDV PGNAGAGRGV SVPARYNIDD GVPPTVTIAP ATTILRAGET 
MSVTFTFSEK VTGFGTEDIQ YDTSKGTLGA LTAVGTDGKV WNATYTPQPG TESANNTIRV 
NLSGVRDAQD NAGVGTGTSG NFGIDTVRPT VNVTISDARL TAGESATITF TFSERVTGFA 
KNAIDLSQAN GTLGDLTPVG TDGTTWTATF TPTARLARTT NNRLTLNLYN VRDAAGNAPA 
ANTYAFNQYT VDTMVFVLSN ATVNREQLVL SYSDETMLDG NADRAPTNES FTVLVDGTRI 
DVSRVTVDAA ARTVTLTLAS AVTTGQTVTV AYQDTDTSDN KAVQEAGTGD DATSFAARAV 
TNLTRPPVAP ATPEAPDAPD SDRDGLSNNR EDQAPGLLRP DGSAGMAGDG NGDGVKDSQQ 
AAVASTRDQT LVAGSQNGKL IPDSNARITE LVRSDAPANL PKGMEMPIGL TSFKVSLAEG 
RSTESFSLYV DQALGANGYW LKNGAGTWVN LASEPYGGKV ASEGGRMRLD FQIQDGGQYD 
ADGLVNGSIS APGAVAKMPL SIVGQSAQVD SHGFWY