Gene CA2559_08051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CA2559_08051
Symbol
ID	9297094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Croceibacter atlanticus HTCC2559
Kingdom	Bacteria
Replicon accession	NC_014230
Strand	-
Start bp	1764457
End bp	1766382
Gene Length	1926 bp
Protein Length	641 aa
Translation table	11
GC content	31%
IMG OID
Product	inter-alpha-trypsin inhibitor heavy chain H2-like protein, precursor
Protein accession	YP_003716357
Protein GI	298208178
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.158508
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGTTTA AATACCCAGA ACTACTTTAC GCGCTTTTTT TACTGGTAAT TCCTATTATC 
GTACATCTTT TTCAGCTTCG TAAATTTCAG AAAGAAGAGT TTACCAATGT TAAGTTCCTC 
CAACGCGTAA TCTTACAAAC ACGAAAAAGC TCTCAACTTA AAAAATGGCT TACATTACTT 
TCACGTCTCT TATTAATGGC GTGTTTAATA ATTGCTTTTG CTCAACCTTT TTTTACTGCA 
AATGATAATG CTACTAAACC ACAAGAGACT GTAATCTACT TAGATAACAG CTTTAGCATG 
CAGGCAAAGG GGCAAAAGGG TGAACTTTTA AAAAGAGCCA TTCAGGAGTT ATTAGAAACA 
CTTCCTGAAG ATGAAGTTTT TACTCTTCTT ACAAATACAG ATAGATTAAA AAATACAACG 
TTAAGAGAGT CTCGAAATGA GATACAAGAA ATTACTTATG ATGCTCAAAG CATATCTGTA 
AACACTGCTT TAATACGTGC TAAAAATGAG TTTTCAAAAA CCAAAGGTGT TGTAAAGAAT 
TTTGTTGCTA TTTCAGACTT TCAAATTAAT GACGATCCAT TTCAGCAAAC TCCTGAGGAG 
ATCTCTGTAA ACTTTGTACA ACTTTCACCT GTAAATAAAG ATAACCTTTC TGTCGATAGT 
GTTTACGTTA AAGATCGTGG CATTAATTCT ATCACATTAG CTACAAAAAT ATCAAGTACT 
GGTTCACTAT CAGGAACACT TCCTGTTGCT CTTTATGACG GTAACACACT TTTAGCCAAA 
ACAAGTGTGC AACTTGAGGA AAACAGCACT TCAGAAACAG TTTTCAACAT ACAAAACCCA 
GAAAGTATTA ACGGCAATAT TCGTGTAGAA GATACTGGTT TACAATATGA CAACATACTA 
TATTTTAGCA TTAACAAACC AGATCCTATT AAGGTAATTG CAATTAGTGA TGTAGATGAT 
AGTTATCTAA AAAAACTATA TAAATCACCA GAATTTGAAC TTATCACTTC AACAACTGCT 
CAATTAGATT ACAACCAATT AAATAATGCT AACTGTATAA TTTTAAATGA AGTCTTGCAA 
TTACCAAATG GGCTTGCTAC TATTTTAAAT AAATTAACAG CAGCAAACGG TACTGTAATA 
ATTGTACCAG CACAAGAAGC TAATATAAAC AGTTACAATT CTTTATTTAA CCAATTAGGA 
TTATCACCTT TATCTGAGTT AAAAAATCAG GAAAAACAAA TTACCAATAT AGTCTTTGCG 
CATCCTATTT ATGAAGGTGT TTTTGATAAG CGTATAGATA ACTTTCAATA CCCTAAGGTA 
CAATCGTATT TTACAACAAC CGCCAATGCT AACAAGGTTT TAGGCTATCA AGATAACTCA 
AGTTTTTTAG AACAAACTGG CAATGTATAC AGATTTACAG CTGCATTAAA TTCTCAAAAT 
TCAAATTTCA AAAATGCGCC ATTAATTGTT CCTACATTTT ATAATATAGC CAAACAAAGC 
TTAAAAGGCG GAACCTTATA TTATACTATA AACAACGCAA ATAGTCTTGA TGTAAATGTG 
GCATTACCAC AAGATGACAT CCTTAAAATT GAAAGTGAAA ATGGGTCTTT TATACCATTG 
CAACAAAACT TTAATTCTAA GGTTCAGATT ACAACTAATG AGCTACCAGA GTTGGCAAAT 
AATTATGTGG TTAAAAACGA AAATCAAGAA TTGCTTAAAC TAAGTTATAA TTATAACCGT 
GACGAAAGTG AGTTAACTTA CCAGAATATT TCTCAACTCG AAAATATTAC AATTAACAAT 
CAAGTATCTT CATTTTTTAA GCAAATGCAA CAAGACAATA GTATAACCGA TTTATGGAAA 
TGGTTTGTTA TTTTTGCACT ACTATTTCTT TGTATAGAAA TACTTCTCTT AAAATTCCTG 
AAATGA

Protein sequence

MQFKYPELLY ALFLLVIPII VHLFQLRKFQ KEEFTNVKFL QRVILQTRKS SQLKKWLTLL 
SRLLLMACLI IAFAQPFFTA NDNATKPQET VIYLDNSFSM QAKGQKGELL KRAIQELLET 
LPEDEVFTLL TNTDRLKNTT LRESRNEIQE ITYDAQSISV NTALIRAKNE FSKTKGVVKN 
FVAISDFQIN DDPFQQTPEE ISVNFVQLSP VNKDNLSVDS VYVKDRGINS ITLATKISST 
GSLSGTLPVA LYDGNTLLAK TSVQLEENST SETVFNIQNP ESINGNIRVE DTGLQYDNIL 
YFSINKPDPI KVIAISDVDD SYLKKLYKSP EFELITSTTA QLDYNQLNNA NCIILNEVLQ 
LPNGLATILN KLTAANGTVI IVPAQEANIN SYNSLFNQLG LSPLSELKNQ EKQITNIVFA 
HPIYEGVFDK RIDNFQYPKV QSYFTTTANA NKVLGYQDNS SFLEQTGNVY RFTAALNSQN 
SNFKNAPLIV PTFYNIAKQS LKGGTLYYTI NNANSLDVNV ALPQDDILKI ESENGSFIPL 
QQNFNSKVQI TTNELPELAN NYVVKNENQE LLKLSYNYNR DESELTYQNI SQLENITINN 
QVSSFFKQMQ QDNSITDLWK WFVIFALLFL CIEILLLKFL K