Gene TM1040_1622 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1622
Symbol
ID	4077724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1728820
End bp	1730139
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	62%
IMG OID	638006935
Product	hypothetical protein
Protein accession	YP_613617
Protein GI	99081463
COG category
COG ID
TIGRFAM ID	[TIGR01554] phage major capsid protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.264122
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAAGA TCCTGGAACT GCGAGCCCGC CGCGCGGGTA TCATCGACCG TATGGACGCG 
CTGGTTGCGT CAATCGGCGA TGGGGAGGAA TGGACAGAGG ATCAGACTGC CCAATTCGAT 
GCCCTGAAGG CCGAAGATGA TAAGGTGACG GCAGAGCTCA CCCGCCTTGA AGATGTGGAG 
CGCCGCCGCG CTGAGGCCGC GCGTCCGGCC GCGCCGCTGC CTGGTGCTGC GGGCACCGAA 
GCTGGTGGGG TACCGACTGC ACCCGCAGCC CCGAAGGAGC CAGGCCTGCA GTTCGCTCGC 
ATGGTGCGCA CGATCGCGGC GGCGGGCGGC AACCAGTATG TTGCACAGCA GATCGCCGAG 
GCGAGCGGAG ACAGCGGTCT TTTTGCCAGC CAGAACATGT CCACCGGCAC CGCCGGCGGA 
TTTCTGGTGC CGGAAGATGT GTCCAGTGAG GTGATCGAGC TGTTGCGCCC GCTCAGCGTC 
GTTACAGCGA TGGGCCCGCG TATTGTTCCC ATGCCGAACG GGAATATGAC TACCAACCGC 
CGCGCGAGCG GAGCAAATTT CGAATATGGC GGTGAGCAGC AGGACATCAA GGCAACCGGA 
TACGAGTATG GTCAGGTGAA GCTGTCGGCG AAGAAGCTGA GCGGGATCAT CCCGATATCC 
AATGACCTGC TGCGCACGGC CTCCACGGCC GTCGACCGAA TGGTGCGCGA TGATGCACTG 
GCCGATGCTG CGCAGATCCA GGATCGTCAT TTCCTCCGCG GTGCGGGAAC AGATTATGCG 
CCAAAGGGGC TTCGTTTCCA GCACACGGGC ACGCCTTTCG CCGCGACCCA TGTGCTGACG 
ATGACCGCTG CGCCGGATCT GCAAAAGGTG GATAACGATC TCGGCCGCCT CGAGCTCGCT 
CTGGCGAACA ACAATGTCGT TGTGACCGGG GCGCATTGGA TCATGTCGCC GCAAATTGCG 
ATGTTCCTGA CCAACCTGCG CGACGGCAAT GGCAACAAGG TTTATCCGGA GATGGCCAAT 
GGCCAGCTGC GCATGAAACC GGTGCACATC ACCACCGAGA TCCCGAGTAA CCTTGGTGGA 
GGCGGCAACG AGTCCGAGAT CATGCTGGCG CATCCGGGTC ACATCCTTGT TGGTGAGCAC 
ATGGGCATTG AAGTCGCGAT GTCTACCGAA GCGGCCTACA AGGACTCCGC GGGCAATATG 
CAGGCCGCGT TCTCTCGCGA CGAGACACTG ATGCGGATGA TCATGCAGCA TGACATTGGC 
CTGCGCCATC TGCCAGCCGT GGCCGTCCTT ACGGGCGTCA CTTGGGCACC CGGCCTCTGA

Protein sequence

MDKILELRAR RAGIIDRMDA LVASIGDGEE WTEDQTAQFD ALKAEDDKVT AELTRLEDVE 
RRRAEAARPA APLPGAAGTE AGGVPTAPAA PKEPGLQFAR MVRTIAAAGG NQYVAQQIAE 
ASGDSGLFAS QNMSTGTAGG FLVPEDVSSE VIELLRPLSV VTAMGPRIVP MPNGNMTTNR 
RASGANFEYG GEQQDIKATG YEYGQVKLSA KKLSGIIPIS NDLLRTASTA VDRMVRDDAL 
ADAAQIQDRH FLRGAGTDYA PKGLRFQHTG TPFAATHVLT MTAAPDLQKV DNDLGRLELA 
LANNNVVVTG AHWIMSPQIA MFLTNLRDGN GNKVYPEMAN GQLRMKPVHI TTEIPSNLGG 
GGNESEIMLA HPGHILVGEH MGIEVAMSTE AAYKDSAGNM QAAFSRDETL MRMIMQHDIG 
LRHLPAVAVL TGVTWAPGL